接近实正在软件开辟的SWE-benchPro基准测试中
发布时间:
2026-04-13 09:27
快科技4月10日动静,跨越GPT-5.4、Claude Opus 4.6。编程能力评分45.3分,正在METR榜单的划一评估尺度下,SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug,正在最接近实正在软件开辟的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成就,此前智谱提到,
最新新闻
扫一扫进入手机网站
页面版权归辽宁J9集团|国际站官网金属科技有限公司 所有 网站地图
