榜单

榜单

来自我们研究团队的 Benchmark 与模型表现。

基准测试

2

评测模型数

8

总冠军

GPT-5.4

1 次夺冠

Bench Family

🥇
GPT-5.455.0
🥈
Claude 4.6 Sonnet54.9
🥉
Qwen 3.6 Plus49.8
🥇
Gemini 3.1 Pro Preview75.4
🥈
GPT-563.3
🥉
Claude Opus 4.661.3
榜单 - Evolvent AI