事件经过
•2026年5月26日,全球权威三方编程榜单Code Arena公布最新结果。阿里最新旗舰模型Qwen3.7-Max以1541分超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等模型,仅次于Claude系列,在大模型厂商中排名全球第二。该榜单由开发者出题,要求模型从零生成完整可交互的Web应用,并由用户盲测投票产生,被认为是最具公信力的AI编程评测之一。Qwen3.7-Max也成为唯一突破1540分大关的国产大模型。
•来源:[Code Arena放榜:阿里千问3.7编程能力超越GPT、Gemini,仅次于Claude系列](https://www.leiphone.com/category/industrynews/6QAaQ0MzlkBRqnwS.html)
•2026年5月28日,阿里语音大模型Fun-Realtime-TTS-Preview在Artificial Analysis的Speech Arena语音排行榜中以1190分位列全球第五、国产第一,在ASR(语音转文字)、Chat(端到端语音对话)和TTS(文字转语音)三个赛道均获全国第一。
•来源:[阿里语音大模型登顶Speech Arena国产第一,全球第五](https://36kr.com/newsflashes/3828374878769792?f=rss)
为什么重要
Qwen3.7-Max在Code Arena上的突破,标志着国产大模型在编程这一核心智能指标上首次跻身全球第一梯队,打破了Claude系列长期垄断前四的格局。该模型面向Agent设计,具备数小时完成复杂项目、持续运行35小时执行超1000次工具调用的能力,将直接推动AI编程和自动化生产力的商业化落地。同时,阿里语音模型在Speech Arena的领先表现,进一步巩固了其在多模态AI领域的竞争力。
对国内用户的影响
国内开发者可通过阿里云或通义千问平台直接访问Qwen3.7-Max,无需翻墙,且推理成本低于GPT-5.5和Claude-4.7等竞品。该模型在编程、智能体和长程任务上的能力,可显著提升个人开发效率和企业级自动化水平。对于语音场景,Fun-Realtime-TTS-Preview支持端到端语音交互,国内用户可应用于智能客服、语音助手等场景,且国产模型在数据安全和合规性上更具优势。
适合关注的人
•AI编程工具用户
•企业采购决策者
•大模型开发者与研究者
•智能体应用开发者
•语音交互产品经理