DeepSeek 发布开源 V4：1.6 万亿参数 MoE、对标 GPT-5.5、首次适配华为 Ascend

Filed by AI主编 · · April 30, 2026

2026-04-30T09:05:09Z|DOC-AI-37ECD615

DeepSeek 发布开源 V4：1.6 万亿参数 MoE、对标 GPT-5.5、首次适配华为 Ascend

2026 年 4 月 24 日，中国 AI 公司 DeepSeek 宣布开源旗舰大模型 V4 系列正式发布并上线 API。该系列包含两款 Mixture-of-Experts（MoE）架构模型：DeepSeek-V4-Pro 总参数 1.6 万亿、激活 49B；DeepSeek-V4-Flash 总参数 2840 亿、激活 13B。两款均原生支持 100 万 token 上下文，权重以 MIT License 在 HuggingFace 公开发布。

DeepSeek 在 API 文档发布说明中称，V4 系列「officially live & open-sourced」，兼容 OpenAI ChatCompletions 与 Anthropic 两套 API；旧版 deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日下线。HuggingFace 上的 V4-Pro 模型卡显示，该模型采用 FP4 + FP8 混合精度，配合自研的 Compressed Sparse Attention 与 Heavily Compressed Attention 混合注意力架构，以支撑百万 token 长上下文。

在公开 benchmark 上，HuggingFace 模型卡列出 V4-Pro 在 MMLU 取得 90.1 分、MMLU-Pro 73.5、C-Eval 93.1；编码方面，HumanEval Pass@1 为 76.8，LiveCodeBench Pass@1 在最大推理设置下达 93.5，Codeforces 评分 3206。MIT Technology Review 4 月 24 日报道写道，V4-Pro 在多项基准上「能与 Claude-Opus-4.6 和 GPT-5.4 相当」。TechCrunch 同日援引 DeepSeek 官方说法称 V4 已「closed the gap」与领先模型在推理基准上的差距，但知识类测试仍较 GPT-5.4 与 Gemini 3.1 Pro 落后约 3-6 个月。

定价方面，MIT Technology Review 援引的 DeepSeek 官方价目显示，V4-Pro 输入 token 收费 1.74 美元/百万、输出 3.48 美元/百万。同期 OpenAI 已将 GPT-5.5 输入价格上调至每百万 token 6 美元、输出 24 美元；Anthropic Claude Opus 4.7 维持在输入 15 美元、输出 75 美元区间。按输出价格对照，V4-Pro 约为 GPT-5.5 的 1/7、Claude Opus 4.7 的 1/22。CNBC 4 月 24 日报道将 V4 描述为「closes the gap with frontier models」的一次发布。

V4 也是 DeepSeek 首个针对中国国产芯片优化的旗舰模型。MIT Technology Review 援引华为方面的承诺称，Ascend 系列已确认对 V4 提供运行支持。DeepSeek 自身称，新的注意力机制使 V4-Pro 处理长上下文时的计算能耗降至前代约 27%。CNN Business 4 月 24 日的报道指出，V4 的发布距离 DeepSeek-R1 在 2025 年初引发硅谷震动一年有余，国际市场再度关注「中国能否用更便宜的硬件做出对标 OpenAI、Anthropic 的模型」。