DeepSeek V4下周上线?原生多模态架构 技术报告同步开放
扫描二维码随身看资讯
使用手机 二维码应用 扫描右侧二维码,您可以
1. 在手机上细细品读~
2. 分享给您的微信好友或朋友圈~
近日,据金融时报报道,DeepSeek 将于下周发布其最新的大模型 V4。

据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在硬件适配方面,DeepSeek 为国产算力提供深度支持,DeepSeek 致力于优化 V4 模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速 AI 模型 " 推理 " 环节靠拢本土芯片。
据一位直接了解相关计划的人士透露,DeepSeek 预计在发布 V4 版本的同时,发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。
V4 会有哪些亮点?
截至发稿,DeepSeek 官方尚未对 V4 的任何信息进行正式回应或确认,所有信息均来媒体爆料,详细信息多集中在正在进行秘密测试的简化版本 V4 Lite(精简版)上。据悉,关于 V4 Lite:
其代号为 "sealion-lite",拥有 100 万(1M)个 tokens 的上下文窗口,相比 V3 系列的 128K 有近 8 倍提升,理论上可一次处理如《三体》全集体量的长文本;
为原生多模态架构,意味着模型从预训练阶段就将文本与视觉理解融合,而非后期拼接;
V4 Lite 参数规模估算为 2000 亿,另有猜测认为完整版 V4 参数量可能突破 1 万亿;
效果显著优于网页端 /APP 端模型;
泄露的测试示例显示,V4 Lite 能用极简代码(如 54 行)生成高质量的 SVG 图像(如 Xbox 手柄),在代码优化和视觉还原度上被认为超越了 DeepSeek V3.2、Claude Opus 4.6 等模型,这暗示了其空间推理和结构化输出能力的提升。
回顾 DeepSeek 的模型迭代之路
DeepSeek 已 " 蛰伏 " 超一年,其上次重大更新—— R1 发布于 2025 年 1 月 20 日。
回顾 DeepSeek 的模型迭代之路,该公司的优化路径十分清晰——提升推理能力、平衡模型性能与推理效率,为大模型 " 降本 "。
DeepSeek 已发布的主要模型是两条技术路线的代表:追求*综合性能的 V 系列 " 全能助手 " 和专注于复杂推理的 R 系列 " 解题专家 "。
2024 年 5 月,DeepSeek V2 发布,被视作 DeepSeek 的*重大突破,其研究团队提出了多头潜在注意力(MLA)机制,大幅降低推理时的显存占用和成本,以极低的推理费用出圈,确立了混合专家模型(MoE)的技术路线。
2024 年 12 月推出的 V3 是 DeepSeek 的重要里程碑,其高效的 MoE 架构确立了强大的综合性能基础。此后,V3 系列通过小版本更新不断打磨,不断提升用户体验和模型 Agent 能力 ¬¬。
其中,2025 年 8 月发布的 DeepSeek-V3.1,是一个里程碑式的更新,*将 V3 和 R1 的能力融合到一个模型中,支持思考模式和非思考模式的自由切换,在 SWE-bench 等基准上比前代提升超 40%;2025 年 12 月推出的 V3.2,是 DeepSeek *将深度思考与工具使用无缝融合的版本,推理能力达到 GPT-5 水平,在 H800 集群上,128K 序列长度的推理成本显著降低:预填充阶段每百万 token 成本从 0.7 美元降至 0.2 美元,解码阶段从 2.4 美元降至 0.8 美元,这一定价使其成为当时同级别模型中长文本推理成本最低的选择之一。
2025 年 1 月发布的 R1,是其首代专用推理模型,*证明通过大规模强化学习(RL)能激发模型的推理能力,通过强化学习,该模型在解决数学问题、代码编程等复杂推理任务上表现卓越,并首创了 " 深度思考 " 模式,性能对标 OpenAI *强模型 o1,但推理成本(仅为约 560 万美元)不到其十分之一。
可以看出,在大家等待 V4 期间,DeepSeek 一直没有停下脚步,另外,其在多模态能力上的布局比 V4 更早。从技术演进来看,DeepSeek 早在 2023 年的 V3 系列和 2024 年的 V2 版本中就已经开始布局和实现多模态能力。2025 年初发布的 Janus 系列更是专门的、功能强大的多模态模型。
- 比亚迪闪充App正式上线:即插即充、无感支付,充电体验大升级!
- AI应用迎来“价值回归” 专家谈“元宝重回苹果App Store前10”:用户真实需求更重要
- 谷歌翻译引入Gemini AI功能,提供同义替换及语境信息
- 美团推出“饭团漫社”,布局漫剧赛道
- 未来3年补贴超200亿!京东“百亿超市”频道正式上线
- 网易《逆水寒》手游官宣联动猪猪侠、非人哉、虹猫蓝兔等
- 肯德基APP基于千问上线智能体小K,可一句话点餐
- 开放6个月VIP权益,阿里健康氢离子上线医生专属“拜年礼”
- 微信推出面对面传输新功能!腾讯客服:文件大小不影响传输速度
- 小红圈App:轻量化知识付费社群平台的发展与价值重构
- 育碧《彩虹六号M》手游今日上线:5v5对战 登陆iOS/安卓
- 蚂蚁阿福APP、支付宝“AI付”用户数双破亿,“两朵花”战略差异化突围
- 1 12306上线4大新功能 开通购火车票选座功能
- 2 微软因UUP无法确定部署完成时间暂停Windows Insider推送
- 3 天猫明令禁止“好评返现”行为 违规商家将被处罚
- 4 Wine团队计划在Android系统上运行Windows应用
- 5 京东双11将于10月9日开启 跨店满减与官方直降的促销费用均由商家承担
- 6 美图M6s怎么样 美图M6s配置介绍
- 7 时隔近七年:淘宝天猫香港站恢复八达通支付
- 8 滴滴AI出行助手公测:语音说需求,自己选更合适的车
- 9 SensorTower发布2025年9月中国手游iOS收入榜:腾讯包揽前四
- 10 亿元补贴就绪!《三国群英传:策定九州》预下载今日开启
-
微软因UUP无法确定部署完成时间暂停Windows Insider推送
据了解,微软上一次推送系统更新时间为11月18日,如今已过去三周时间
-
苹果正在采取措施解决iCloud日历垃圾邀请问题
近日,苹果的发言人发表一份声明称,苹果公司正在努力阻止垃圾邀请问
-
12306上线4大新功能 开通购火车票选座功能
还有两个月就是春节了,不过车票差不多要开始销售了。而近日,如果你
-
美图M6s怎么样 美图M6s配置介绍
今天美图官网,正式上架了美图M6s,此款自拍神器售价2399元,将在12月9

