国产第一!阿里千问3.7登顶国产最佳模型

超人 2026-06-21 1 0

扫一扫用手机浏览

文章目录 [+]

5月21日,第三方机构 Artificial Analysis 更新全球大模型榜单,阿里 Qwen3.7-Max 以56.6分超过Kimi、DeepSeek等国产模型,位列全球第五、国产第一。

但我觉得,这次最值得关注的,其实已经不是“谁第一”了。

而是国产大模型的竞争方向,彻底变了。

以前大家卷的是:谁更像最聪明的聊天机器人。

现在开始卷的是:谁更像真正能干活的AI员工。

你会发现,这次Qwen3.7-Max重点强调的,已经不是聊天能力,而是:Agent、自主编程、工具调用、长程任务。

甚至官方提到,它可以连续执行35小时任务,完成超1000次工具调用,还能兼容 Claude Code、OpenClaw、Hermes Agent 等各种Agent框架。

这背后释放了一个特别明显的信号:AI行业,正在从“聊天时代”,进入“执行时代”。

以前的大模型,更像一个会回答问题的人。但现在行业真正想做的,是一个能持续工作的数字员工。

它不仅要会聊天,还要会写代码、调工具、跑流程、拆解任务、连续执行。
而阿里现在的路线,也越来越清晰了。

Qwen快速迭代,百炼铺生态,强化Agent能力,持续推进开源。

它不像OpenAI那种“超级闭源大脑”的打法,反而越来越像:
AI时代的安卓生态。

它想做的,已经不只是一个模型。

而是未来所有AI应用、Agent、工作流背后的底层基础设施。

因为未来真正值钱的,可能已经不是“谁最会聊天”。

而是谁最能:替人真正干活。

从这个角度看,Qwen3.7-Max这次拿下国产第一,更像是一个行业信号:国产模型,已经开始从“卷参数、卷榜单”,进入“抢AI操作系统入口”的阶段了。(转载自AI普瑞斯)

你可能想看:

相关文章

多名博主致歉:全额退款

近日,央视曝光“澳洲优思益”虚构海外产地、伪造品牌背景,所谓墨尔本工厂实为汽修厂,产品实为国内代工生产。“澳洲优思益”是抖音、天猫...

coonline新闻 2026-06-21 1 0