京东即将开源视觉语言实时交互模型

超人 2026-06-21 1 0

扫一扫用手机浏览

文章目录 [+]

6月17日,《科创板日报》记者独家获悉,京东团队即将开源视觉语言实时交互模型JoyAI-VL-Interaction。

记者从一份在开源社区和海外AI技术圈受到关注的技术报告获悉,JoyAI-VL-Interaction把多模态大模型从"一问一答",推进到"实时流式交互",适合需要AI持续在场的场景。报告将JoyAI-VL-Interaction与豆包、Gemini 的App内视频通话助手进行了人工评测,覆盖监控预警、实时计数、实时翻译、时间感知、直播解说和引导、长程记忆六类场景。

在58个案例中,JoyAI-VL-Interaction对豆包的总体胜率为77.6%,对Gemini的总体胜率为87.9%。其中,在监控预警场景中,对两个基线均取得100%胜率。 (科创板日报)

你可能想看:

相关文章

多名博主致歉:全额退款

近日,央视曝光“澳洲优思益”虚构海外产地、伪造品牌背景,所谓墨尔本工厂实为汽修厂,产品实为国内代工生产。“澳洲优思益”是抖音、天猫...

coonline新闻 2026-06-21 1 0