能看懂、听懂!豆包Seed 2.0 Lite升级:*全模态理解模型
扫描二维码随身看资讯
使用手机 二维码应用 扫描右侧二维码,您可以
1. 在手机上细细品读~
2. 分享给您的微信好友或朋友圈~
昨日,火山引擎宣布,Doubao-Seed-2.0-lite升级新版本,这是豆包大模型家族*全模态理解模型。
据介绍,新版Doubao-Seed-2.0-lite支持视频、图像、音频、文本的原生统一理解,Agent、Coding与GUI能力也同步升级,进一步面向复杂业务场景增强多模态推理能力。

在视觉理解方面,Doubao-Seed-2.0-lite继续大幅提升,在物理HiPhO、医疗MedXpertQA等高阶学科推理任务上,新版本表现已大幅超越今年2月发布的Doubao-Seed-2.0-pro。
同时,该模型在细粒度感知BabyVision、WorldVQA,以及具身理解ERQA等关键领域达到SOTA水平,更适合企业在高价值场景中进行规模化部署。

加粗表示*优结果,下划线表示次优结果
此次升级的一大重点是融入语音理解能力,新版本可同时理解多种输入模态,并完成跨模态联合推理,能够直接处理那些必须“音画结合”才能判断的复杂业务需求。
例如在视频理解场景下,Doubao-Seed-2.0-lite可以联合分析视频画面与音频信息,精准判断视频中的视听一致性,也就是“看到的”和“听到的”是否匹配。
它还支持根据自然语言指令,在视频中精准定位特定事件发生的时间点,并能跨越多个时间段提取关键线索,持续追踪人物与事件发展,基于画面进行多步逻辑推理,还原事件关系与行为脉络。
音频能力方面,新模型支持19个语种的精准语音转写,以及中英文与其他14个语种互译。
此外,它还能捕捉语音中的情绪变化、环境背景声与音乐细节,输出更完整、更接近人类认知的语义信息。

根据公开评测集,Doubao-Seed-2.0-lite在语音识别、翻译等多项音频理解基准上优于Gemini-3.1-Pro。
值得一提的是,Doubao-Seed-2.0-lite还深度适配OpenClaw、Hermes Agent等框架,强化深度搜索与Skill动态调用,可在执行任务过程中持续沉淀经验,实现“越用越聪明”。
- 腾讯《王者荣耀》×电影《哪吒之魔童闹海》联动内容公布
- 考试宝典APP累计下载量突破4000万,AI智能助学*医考赛道
- 高德专车引入“AI专车管家”:嵌入接驾、行程与服务全流程
- 支付宝正式接入苹果NFC交通卡!iPhone刷卡无需提前充值
- 五一出游“语言搭子”火了,有道翻译官App“耳机同传”功能使用量翻倍增长!
- 抖音上线付费聊天装扮商城,对标QQ*试水社交商业化
- 红果短剧回应VIP付费:并非新增!仅极少量版权方要求内容
- 豆包官方确认收费:将在免费模式外新增付费订阅 主打生产力场景
- 网易云音乐发起十三周年庆特别企划 在音乐里和自己反复重逢
- 腾讯QQ闪传功能更新,支持一键转存空间相册、选图预览大图等
- 企业微信上线记录面聊功能:动动嘴就有文字了
- DeepSeek多模态功能开启灰度测试,识图模式已上线
- 1 12306上线4大新功能 开通购火车票选座功能
- 2 微软因UUP无法确定部署完成时间暂停Windows Insider推送
- 3 天猫明令禁止“好评返现”行为 违规商家将被处罚
- 4 京东双11将于10月9日开启 跨店满减与官方直降的促销费用均由商家承担
- 5 Wine团队计划在Android系统上运行Windows应用
- 6 时隔近七年:淘宝天猫香港站恢复八达通支付
- 7 滴滴AI出行助手公测:语音说需求,自己选更合适的车
- 8 美图M6s怎么样 美图M6s配置介绍
- 9 SensorTower发布2025年9月中国手游iOS收入榜:腾讯包揽前四
- 10 网易《逆水寒》手游秋季大资料片《越关山》定档月底
-
微软因UUP无法确定部署完成时间暂停Windows Insider推送
据了解,微软上一次推送系统更新时间为11月18日,如今已过去三周时间
-
苹果正在采取措施解决iCloud日历垃圾邀请问题
近日,苹果的发言人发表一份声明称,苹果公司正在努力阻止垃圾邀请问
-
12306上线4大新功能 开通购火车票选座功能
还有两个月就是春节了,不过车票差不多要开始销售了。而近日,如果你
-
美图M6s怎么样 美图M6s配置介绍
今天美图官网,正式上架了美图M6s,此款自拍神器售价2399元,将在12月9

