亚博 DeepSeek-V4上线：使用华为芯片考验，性能比Gemini差3-6个月，价钱上风彰着

出品｜搜狐科技

作家｜郑松毅常博硕

剪辑| 杨锦

DeepSeek V4，来了！

OpenAI GPT 5.5 前脚刚发布，DeepSeek就亮出了“真家伙”。

就在刚刚，DeepSeek-V4的预览版块认真上线并同步开源。

据官方先容，DeepSeek-V4领有百万字超长高下文，在 Agent 才气、天下学问和推感性能上均已矣国内与开源范围的来源。模子按大小分为两个版块：

更具产业里程碑道理的是，DeepSeek-V4 从模子遐想之初就深度适配国产算力，在昇腾芯片生态实测跑通，成为全球首个在国产算力底座上完成考验与推理的万亿参数级模子，冲破对国际芯片与框架的耐久依赖。

性能并排顶级闭源模子

价钱比Claude低廉21倍

官方实测数据显现，DeepSeek-V4-Pro性能并排顶级闭源模子。

Agent（智能体）才气方面，比拟前代模子，DeepSeek-V4-Pro的才气显赫增强。在 Agentic Coding 评测中，V4-Pro 已达到现时开源模子最好水平，并在其他 Agent 关系评测中雷同线路优异。

DeepSeek先容，现在 DeepSeek-V4 已成为公司里面职工使用的 Agentic Coding 模子，据评测反映使用体验优于 Sonnet 4.5，录用质地接近 Opus 4.6 非念念考状态，但仍与Opus 4.6 念念考状态存在一定差距。

DeepSeek给出的论断相对克制。在学问与推理任务上，其性能也曾跳动主流开源模子，并接近Gemini等闭源系统，但仍存在约3到6个月差距。在 agent和代码任务上，其线路接近以致部分跳动Claude Sonnet。

此外，在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro罕见现时总共已公开评测的开源模子（包括月之暗面的K2.6 Thinking、智谱GLM-5.1 Thinking等），赢得了并排天下顶级闭源模子的优异成绩。

相较之下，DeepSeek-V4-Flash主打性价比，大要提供愈加速捷、经济的 API 业绩。在 Agent 测评中，DeepSeek-V4-Flash 在通俗任务上与 DeepSeek-V4-Pro 旗饱读极度，但在高难度任务上仍有差距。

据悉，V4-Pro 与 V4-Flash 最大高下文长度为 1M，均同期维持非念念考状态与念念考状态，其中念念考状态维持 reasoning_effort 参数建造念念考强度（high/max）。关于复杂的 Agent 场景无情使用念念考状态，并建造强度为 max。使用价钱如下：

DeepSeek示意，“受限于高端算力，现在Pro的业绩微辞十分有限，展望下半年昇腾950超节点批量上市后，Pro的价钱会大幅下调。”

再望望国际友商价钱对比，可见DeepSeek的实惠：

夹杂架构贬责工程落地痛点

全面适配国产算力

大模子处理超长文本的最大痛点，从来不是 “能不可装下”，而是跑不动、记不住、算不起。跟着传统贯注力机制呈平日级复杂度攀升，百万Token场景下显存与算力径直 “爆炸”，亚博体彩app确凿无法工程落地。

DeepSeek-V4 的发布，象征着大模子认真走出 “参数竞赛”，插足截止优先下一代赛谈。

从连气儿审计全量代码库、一次性判辨千页公约，到全程记着万古刻会议、串联多轮复杂智能体任务，V4让AI 实在具备“完整领会、耐久回首、深度推理”的才气，同期把使用本钱大幅下拉。

这一切成绩于DeepSeek业内开创“CSA （压缩稀疏贯注力） + HCA （重度压缩贯注力）”的夹杂架构。用一套“分级压缩 + 分级检索”念念路，把截止拉到极致。这一新行径显赫减少了计较复杂度，辅导了长高下文处理的截止。

具体来看，CSA像给长文本作念重心精读。先把每 4 个Token压缩成一个信息块，再用稀疏检索只挑最关系的本体，既保留中段细节，又大幅削减计较量，兼顾精确与截止。HCA像给长文本作念大纲速读，把海量信息浓缩成框架级块，特地负责全局逻辑。

官方数据显现：1M Token场景下，V4-Pro 仅需 V3.2 的 27% 推理算力、10% KV 缓存；Flash 版更是低至 10% 算力、7% 缓存。

除了夹杂贯注力，V4 还带来三项关节本领改进，组成完整截止翻新：

升级传统残差相接，把信号传播照管在安适流形上，深层不衰减、考验不炸数值。

Muon 优化器：替代传统 AdamW，拘谨更快、考验更稳，竣工适配 MoE 大模子与低精度考验，贬责多半次长高下文考验的抖动繁重。

全链路工程优化：人人并行细粒度通讯肖似、TileLang 内核拓荒、FP4 量化感知考验、异构 KV 缓存管理，从计较、通讯、存储全方向降本提速，推理加速最高近2倍。

最受群众关注的，是V4此次是否收效全面适配国产算力？

阐述指出，DeepSeek-V4在英伟达 GPU 与华为昇腾 NPU 两大硬件平台上，对细粒度 EP 优化有贪图完成了全面考证。相较于性能优异的非交融基线有贪图，该有贪图在通用推理负载场景下可已矣1.50~1.73 倍的加速比。

有业内不雅点指出，这代表也曾完成华为昇腾平台的适配和实测落地。但现在对外开源的惟有英伟达GPU版块，昇腾适配代码未开源，属于闭源适配优化。

值得一提的是，寒武纪在软硬一体生态中，也曾完成基于 vLLM 推理框架完成对 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的适配，适配代码已开源到 GitHub 社区。

剩下的，就等DeepSeek-V4的实用线路了。还有DeepSeek的首轮融资最终花落谁家，也照旧个谜题。

“不诱于誉，不恐于诽，率谈而行，端然正己。”

DeepSeek官方在著作临了示意，他们将长期秉合手耐久方针的原则理念，在尝试与念念考中平稳前行，奋发向已矣 AGI 的掂量阻挡围聚。”

运营剪辑 |曹倩审核｜孟莎莎

开云体育中国官网入口