中广联演员委员会就AI换脸合成、影视素材魔改发声明
4月2日,据中国广电联合会演员委员会,当前,AI换脸合成、声纹克隆复刻、影视素材任意篡改、魔改、擅自抓取演员影像声频用于AI模型训...
扫一扫用手机浏览
在SWE-bench Verified、Terminal-Bench 2、NL2Repo等编程基准测试中,Qwen3.6-Plus取得了超过GLM-5、Kimi K2.5的成绩,不过在部分基准测试中的得分仍低于Claude Opus 4.5。
在Claw-Eval、QwenClawBench等真实世界Agent能力评测中,Qwen3.6-Plus的表现同样超过了多款国产模型,与Claude Opus 4.5同处一个梯队。
▲Qwen3.6-Plus基准测试对比(图源:阿里)
不过,需要注意的是,这张基准测试图的图表纵轴刻度间隔并不一致,在SWE-bench Verified、MMMU、RealWorldQA、QwenClawBench等测试中,几个对比模型的实际得分差距并没有特别明显。 智东西立刻上手体验了Qwen3.6-Plus的编程能力,让它在Claude官方的前端设计Skill指导下,打造了一个AI眼镜独立站,历经三轮对话,耗时8分钟左右,消耗2.5万个token(约等于0.15元)。 可以看到在提示词的要求下它打造的网页完成度不错,根据Skill的要求避免了一些老掉牙的AI味设计风格,不过在字体选择上依然是较为常见的类型。
实测结果:
https://mcp.edgeone.site/share/57IuyACJqUk1GjKHY9I4c
与上一代模型类似,Qwen3.6-Plus也是一个原生多模态模型。Qwen3.6-Plus这次重点提升了多模态推理和指令模式实用性。
官方Demo中用北京地铁路径规划的题目考了考Qwen3.6-Plus,我们同样试了一下,让模型规划出从北京大兴机场到北京首都机场的最快路线,它的方案与高德上的最快路径一致。
将编程能力与多模态能力结合后,Qwen3.6-Plus还解锁了视觉智能体编程能力,可基于界面截图、设计稿或自然图文描述,完成前端页面生成、代码补全、交互修改等任务。
目前,Qwen3.6-Plus的API已经开放调用,用户可在Qwen Chat中体验到这一模型。这次阿里还为API引入了一项新功能“preserve_thinking”,可保留消息中所有前序轮次的思维内容,该功能推荐用于智能体任务。其API的原价为4元/百万输入tokens,12元/百万输出tokens,目前有限时5折的优惠。
值得一提的是,阿里在企业级市场的AI应用“悟空”第一时间接入了Qwen3.6-Plus。
Qwen Chat:
https://chat.qwen.ai/
阿里云百炼: https://bailian.console.aliyun.com/cn-beijing?tab=model#/model-market/detail/qwen3.6-plus
在实测中,我们的这一案例融合考察了编程与工具调用能力,要求Qwen3.6-Plus统计A股目前股价最高的10家公司,并生成完整统计网页,带有每家公司的跳转链接。
在任务执行过程中,Qwen3.6-Plus调用了7轮搜索工具,统计了数十个网站的数据,最终交付了如下的结果,耗时大概7分钟左右。
▲Qwen3.6-Plus生成的排名
Qwen3.6-Plus选择了权威的数据来源,右侧查看详情链接的跳转正常,排名正确,数据则取的是近似值。在思维链中可以看到它多次在同一个问题上反复思考,搜索多次但获得的内容差不多,在任务执行速度和token效率上仍有一定提升空间。
▲右侧是Qwen3.6-Plus的思维链摘要
接下来,我们又要求Qwen3.6-Plus生成一个《潜水员戴夫》的同款游戏,不过,Qwen3.6-Plus先是拒绝了这一要求,称它无法直接生成可执行的游戏文件,但可以为我生成核心概念美术图,并提供一套完整的《潜水员戴夫》风格游戏设计蓝图+开发指南+基础代码框架,作为开发起点。
再次要求后,Qwen3.6-Plus开始了开发,但是在写到200多行代码时出现了问题,于是停止了开发。
之后我们尝试了通过API调用这一模型,完成同一任务。模型认为,打造《潜水员戴夫》同款独立游戏的核心在于复刻其“白天探索采集+夜晚模拟经营+轻叙事驱动+循环成长”的节奏,而非照搬题材或代码。它决定打造一个白天深入动态雾林采集食材与古物,夜晚经营一家能“烹饪记忆”的森林酒馆的游戏。
最终Qwen3.6-Plus交付的MVP版本(最小可用版本)如下,不过我们试玩了一下,这一游戏在可玩性上仍然需要持续迭代。
为考察其视觉推理能力,我们在之前的地铁路径规划任务上加了点难度,假设某一线路遇到了极端天气停运了,看看模型还能不能反应过来。
Qwen3.6-Plus通过较长时间的思考后,得出了两个结论,第一个结论其实是正确的,但是它判断这条路线有点复杂,于是认为可以在“牡丹园站换乘昌平线”,这样更直接。Qwen3.6-Plus的最终结论有个bug,昌平线可能至少要等到2029年才能和19号线在牡丹园换乘。
在其他多模态能力方面,阿里官方还展示了多个demo。比如,Qwen3.6-Plus可以对视频进行分析,并生成图文并茂的讲义。
或是根据界面截图、产品原型、设计稿或自然图文描述,完成前端页面生成、代码补全、交互修改等任务。