全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 247|回复: 0

GPT 5.5发布,在AI agent工具调用协调方面 遥遥领先!

[复制链接]
发表于 6 小时前 | 显示全部楼层 |阅读模式
        Rank        Agent        Model        Date        Agent Org        Model Org       
Accuracy

       
1
Codex        GPT-5.5        2026-04-23        OpenAI        OpenAI       
82.0%± 2.2

       
2
ForgeCode        GPT-5.4        2026-03-12        ForgeCode        OpenAI       
81.8%± 2.0

       
3
TongAgents        Gemini 3.1 Pro        2026-03-13        BIGAI        Google       
80.2%± 2.6

       
4
ForgeCode        Claude Opus 4.6        2026-03-12        ForgeCode        Anthropic       
79.8%± 1.6

       
5
SageAgent        GPT-5.3-Codex        2026-03-13        OpenSage        OpenAI       
78.4%± 2.2

       
6
ForgeCode        Gemini 3.1 Pro        2026-03-02        ForgeCode        Google       
78.4%± 1.8

       
7
Droid        GPT-5.3-Codex        2026-02-24        Factory        OpenAI       
77.3%± 2.2

       
8
Capy        Claude Opus 4.6        2026-03-12        Capy        Anthropic       
75.3%± 2.4

       
9
Simple Codex        GPT-5.3-Codex        2026-02-06        OpenAI        OpenAI       
75.1%± 2.4

       
10
Terminus-KIRA        Gemini 3.1 Pro        2026-02-23        KRAFTON AI        Google       
74.8%± 2.6



======================================================

国产开源模型 kimi最高, 排名62  
62
Terminus 2        Kimi K2.5        2026-02-04        AfterQuery        Kimi       
43.2%± 2.9
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-4-24 20:14 , Processed in 0.053758 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表