国产第一！阿里千问3.7登顶国产最佳模型_coonline新闻

文章目录 [+]

5月21日，第三方机构 Artificial Analysis 更新全球大模型榜单，阿里 Qwen3.7-Max 以56.6分超过Kimi、DeepSeek等国产模型，位列全球第五、国产第一。

但我觉得，这次最值得关注的，其实已经不是“谁第一”了。

而是国产大模型的竞争方向，彻底变了。

以前大家卷的是：谁更像最聪明的聊天机器人。

现在开始卷的是：谁更像真正能干活的AI员工。

你会发现，这次Qwen3.7-Max重点强调的，已经不是聊天能力，而是：Agent、自主编程、工具调用、长程任务。

甚至官方提到，它可以连续执行35小时任务，完成超1000次工具调用，还能兼容 Claude Code、OpenClaw、Hermes Agent 等各种Agent框架。

这背后释放了一个特别明显的信号：AI行业，正在从“聊天时代”，进入“执行时代”。

以前的大模型，更像一个会回答问题的人。但现在行业真正想做的，是一个能持续工作的数字员工。

它不仅要会聊天，还要会写代码、调工具、跑流程、拆解任务、连续执行。
而阿里现在的路线，也越来越清晰了。

Qwen快速迭代，百炼铺生态，强化Agent能力，持续推进开源。

它不像OpenAI那种“超级闭源大脑”的打法，反而越来越像：
AI时代的安卓生态。

它想做的，已经不只是一个模型。

而是未来所有AI应用、Agent、工作流背后的底层基础设施。

因为未来真正值钱的，可能已经不是“谁最会聊天”。

而是谁最能：替人真正干活。

从这个角度看，Qwen3.7-Max这次拿下国产第一，更像是一个行业信号：国产模型，已经开始从“卷参数、卷榜单”，进入“抢AI操作系统入口”的阶段了。（转载自AI普瑞斯）