榜单
榜单
来自我们研究团队的 Benchmark 与模型表现。
基准测试
2
评测模型数
8
总冠军
GPT-5.4
1 次夺冠
Bench Family
🥇
GPT-5.455.0
🥈
Claude 4.6 Sonnet54.9
🥉
Qwen 3.6 Plus49.8
🥇
Gemini 3.1 Pro Preview75.4
🥈
GPT-563.3
🥉
Claude Opus 4.661.3
榜单
来自我们研究团队的 Benchmark 与模型表现。
基准测试
2
评测模型数
8
总冠军
GPT-5.4
1 次夺冠