DeepSeek 发布开源 V4:1.6 万亿参数 MoE、对标 GPT-5.5、首次适配华为 Ascend

2026 年 4 月 24 日,中国 AI 公司 DeepSeek 宣布开源旗舰大模型 V4 系列正式发布并上线 API。该系列包含两款 Mixture-of-Experts(MoE)架构模型:DeepSeek-V4-Pro 总参数 1.6 万亿、激活 49B;DeepSeek-V4-Flash 总参数 2840 亿、激活 13B。两款均原生支持 100 万 token 上下文,权重以 MIT License 在 HuggingFace 公开发布。
DeepSeek 在 API 文档发布说明中称,V4 系列「officially live & open-sourced」,兼容 OpenAI ChatCompletions 与 Anthropic 两套 API;旧版 deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日下线。HuggingFace 上的 V4-Pro 模型卡显示,该模型采用 FP4 + FP8 混合精度,配合自研的 Compressed Sparse Attention 与 Heavily Compressed Attention 混合注意力架构,以支撑百万 token 长上下文。

在公开 benchmark 上,HuggingFace 模型卡列出 V4-Pro 在 MMLU 取得 90.1 分、MMLU-Pro 73.5、C-Eval 93.1;编码方面,HumanEval Pass@1 为 76.8,LiveCodeBench Pass@1 在最大推理设置下达 93.5,Codeforces 评分 3206。MIT Technology Review 4 月 24 日报道写道,V4-Pro 在多项基准上「能与 Claude-Opus-4.6 和 GPT-5.4 相当」。TechCrunch 同日援引 DeepSeek 官方说法称 V4 已「closed the gap」与领先模型在推理基准上的差距,但知识类测试仍较 GPT-5.4 与 Gemini 3.1 Pro 落后约 3-6 个月。
定价方面,MIT Technology Review 援引的 DeepSeek 官方价目显示,V4-Pro 输入 token 收费 1.74 美元/百万、输出 3.48 美元/百万。同期 OpenAI 已将 GPT-5.5 输入价格上调至每百万 token 6 美元、输出 24 美元;Anthropic Claude Opus 4.7 维持在输入 15 美元、输出 75 美元区间。按输出价格对照,V4-Pro 约为 GPT-5.5 的 1/7、Claude Opus 4.7 的 1/22。CNBC 4 月 24 日报道将 V4 描述为「closes the gap with frontier models」的一次发布。
V4 也是 DeepSeek 首个针对中国国产芯片优化的旗舰模型。MIT Technology Review 援引华为方面的承诺称,Ascend 系列已确认对 V4 提供运行支持。DeepSeek 自身称,新的注意力机制使 V4-Pro 处理长上下文时的计算能耗降至前代约 27%。CNN Business 4 月 24 日的报道指出,V4 的发布距离 DeepSeek-R1 在 2025 年初引发硅谷震动一年有余,国际市场再度关注「中国能否用更便宜的硬件做出对标 OpenAI、Anthropic 的模型」。
Comments
0Sign in to join the discussion.
Go to sign in