榜单

榜单

来自我们研究团队的 Benchmark 与模型表现。

基准测试

2

评测模型数

8

总冠军

GPT-5.4

1 次夺冠

Bench Family

🥇

GPT-5.455.0

🥈

Claude 4.6 Sonnet54.9

🥉

Qwen 3.6 Plus49.8

🥇

Gemini 3.1 Pro Preview75.4

🥈

GPT-563.3

🥉

Claude Opus 4.661.3

榜单 - Evolvent AI