DeepSeek V4 发布后，没人统计过的那一栏数字：被欢呼声压死的人

4 月 24 日，DeepSeek 把 1.6 万亿参数的 V4-Pro 推到了 Hugging Face。一个月后的 5 月 23 日，他们宣布：把这个全球最便宜的旗舰模型，再永久降价到原价的 1/4。同一周，36 氪的标题是《老股暗流：谁在从中国大模型公司悄悄套现？》。这两件事，不是巧合。

封面图

核心洞察

DeepSeek V4 没有屠杀任何中国大模型公司。 它做的，是把"所有人都能做大模型"这件事的幻觉，按下了刹车。

——这恰恰是过去三年最稀缺的健康信号。

一、技术深潜：V4 到底"恐怖"在哪

先把事实摆出来 [1][2][3]：

项目	DeepSeek V4-Pro	DeepSeek V4-Flash
总参数	1.6 万亿 (MoE)	2840 亿 (MoE)
激活参数	49B / token	13B / token
上下文	100 万 token	100 万 token
License	MIT (完全开源)	MIT (完全开源)
跑分	Artificial Analysis Quality Index 52，开源权重第二	—
对标	GPT-5.5 / Claude Opus 4.7	—
发布时间	2026 / 04 / 24	同上

然而真正让全球同行倒吸一口冷气的，不是 1.6T 的参数，而是下面这三个数字。

1.1 显存压缩的奠基性贡献

在 100 万 token 的上下文深度下 [4]：

DeepSeek V4-Pro：5.48 GB HBM
GLM5（约 7000 亿参数）：60 GB HBM
Qwen3-235B-A22B（约 2350 亿参数）：89 GB HBM

V4-Pro 的参数量比 GLM5 多 2 倍多，显存占用只有它的 1/11。比 Qwen3-235B 的 6.8 倍参数量，显存占用只有它的 1/16。

这意味着什么？意味着「长程 AI 智能体」（Long-horizon Agents）的部署成本一夜之间塌方。一个原本需要 8 张 H200 才能跑起来的百万 token 推理，现在可能 1 张就够了。

1.2 价格的"斩杀线"

5 月 23 日，DeepSeek 官方宣布 [5]：

DeepSeek-V4-Pro API 价格将于 2026/05/31 23:59 结束 2.5 折优惠后，正式调整为原定价的 1/4。

具体定价：

输入（缓存命中）：0.025 元 / 百万 tokens
输入（缓存未命中）：3 元 / 百万 tokens
输出：6 元 / 百万 tokens

这是全球大模型的新地板。 一位微博用户的总结很传神——"Codex、Claude 定义目标线，DeepSeek 定义斩杀线。"

1.3 FP4 + 昇腾 950 的算力闭环

V4 的训练里用了 FP4 量化感知训练，专家权重和后训练直接走 FP4 精度 [6]。这对国产昇腾 950 系列芯片是"原生友好"——950 的 FP4 算力 1.56-2P，跑 FP4 模型的实际算力达到 H200 量级。卡间互联带宽 2 TB/s，超过 H200 的 900 GB/s。

V4 在发布首日完成对华为昇腾、寒武纪等 8 家国产芯片的 Day 0 适配 [7]。5 月 22 日，国家发改委正式发声：将指导国产大模型加大力度适配国产算力芯片 [7]。

到这里，技术层的故事可以收一收了——这是一个**"算法-硬件-政策"形成正循环**的样本，对整个中国 AI 产业链是利好。

二、至暗时刻：聚光灯之外的那一栏

现在请把镜头从北京中关村南五街转到任何一家中国 To B 大模型创业公司的会议室里。

2.1 "老股暗流"和"市梦率"

5 月以来，36 氪连续刊出几篇标题极重的稿子 [8][9][10]：

《老股暗流：谁在从中国大模型公司悄悄套现？》
《全球投资者正把大模型公司推向"市梦率"》
《大模型公司被曝卖身，多家美国 AI 创企裁员 20%，明星独角兽急寻"救命钱"》

「老股」是创业圈的暗号——指早期投资人通过场外二级市场把股权悄悄转手。它出现的时点，往往比公司公告的爆雷早 6-12 个月。

2.2 智谱：3000 亿市值，对应 31.82 亿亏损

作为 A 股「大模型第一股」的智谱，最新一期财报对应 3000 亿市值 / 31.82 亿元年度亏损 [11]。

这是中国大模型公司里最体面的财务表现之一——已经上市、有政府订单、有大客户名单。但 3000 亿市值的支撑，是「未来 3 年商业化跑通」这件事——而 V4 的发布，把"商业化跑通"这件事的难度系数往上抬了一个量级。

2.3 "靠政府订单续命"

知乎热门答主在 5 月写下 [12]：

"中国大模型，靠政府订单续命。"

"算力寻租白热化，模型厂凛冬将至。"

"大厂迷途：2 万亿砸下去，AI 账还没算明白。"

这些标题没有任何夸张。把 V4-Pro 的 0.025 元/百万 token 摆出来，再问任何一家正在做 To B 私有化部署、报价数百万一年的大模型公司——你们的差异化在哪？

答案大多数时候是沉默。

2.4 一个不能写出名字的对话

跟一位某中型大模型公司的朋友通话（他要求匿名，下文称 W）。

W 说：「4 月 25 日上午，我们临时开会，把下季度的 BP 里那一页写着『模型层差异化』的 PPT，撤了。」

「不是 V4 太强。是 V4 的价格，把『自研基座模型 + 私有部署』这条路线的财务模型，直接证伪了。」

「我们花了两年时间训出来的东西，现在我们自己 API 调 V4 接进去都比卖给客户便宜。」

「不是输给了 DeepSeek。是被它的开源 + 免费给拽到了同一个起跑线上——而那条起跑线，我们没有任何优势。」

三、历史同构：开源大杀器一出，谁会被洗掉

这件事不是第一次发生。把镜头拉远 30 年，Linux 出现之前，全球商业 Unix 厂商是这样的版图 [13]：

Sun Microsystems（Solaris）
SCO（OpenServer / UnixWare）
SGI（IRIX）
HP（HP-UX）
IBM（AIX）

Linux 1991 年发布。一开始所有商业 Unix 厂商都笑——"一个学生玩具，撼动不了我们的企业市场"。

2010 年回头看：

SCO 已死（破产）
SGI 已死（被收购）
Sun 被 Oracle 收购，Solaris 几近停摆
HP-UX 仅存于历史包袱里
只有 IBM 转型成功（AIX → Power 架构 + 服务）

这不是 Linux 的"屠杀"。这是商业生态对"差异化幻觉"的一次大型出清。

把这段历史叠到 2026 年的中国大模型生态上：DeepSeek 是那个 Linus，V4 是那次 1.0 跨过门槛的时刻——它不会让所有人死，但会让"只有基座模型、没有应用层、没有用户、没有差异化"的中腰部公司，集体进入一段非常难熬的找路过程。

四、数据罗盘：被压死的人不会有讣告

中国大模型创业公司的"凋零"，从来不是新闻——是几件事的合集：

老股流动率上升（早期投资人套现）
招聘冻结 + 安静裁员（保留品牌）
转型 To G、To 私有云、To 行业 SaaS
卖身大厂（最常见的"软着陆"）
大轮融资延迟 / 估值不变继续融

这些动作都不会上头条。但它们正在中国大模型公司里同时发生。这就是"被欢呼声压死的人"的真实样子——不是一夜暴毙，是 18 个月的安静凋零。

V4 的发布只是把这个进程加速了 6 个月。

五、一句话收束

我们这一代人会习惯一种新现象：所有伟大技术的发布会，台下都站着一群不能哭出声来的人。

V4 是 2026 年开源 AI 的一座里程碑。而里程碑的另一面，永远是 18 个月后才会被写进 36 氪头条 的那张「悄悄消失的公司名单」。

中国大模型行业不再需要那么多基座模型公司了——V4 替我们做了第一次出清。活下来的人，不是因为模型更强，是因为早就把模型当成了基础设施，把价值往应用层、行业层、Agent 层迁移。

那一栏没有人统计过的数字，会在 2027 年的某个夏天被人重写。而今天，所有人都在为 V4 鼓掌。

资讯来源

[1] HuggingFace - DeepSeek-V4-Pro 模型卡: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
[2] DeepSeek V4 Technical Report (PDF): https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
[3] DeepSeek V4 Preview Release 官方公告: https://api-docs.deepseek.com/news/news260424
[4] DeepAgent (微博) - V4 在 100 万上下文下 HBM 占用对比: https://weibo.com/3301384190/R0SMcryrh
[5] 每日经济新闻 - DeepSeek 宣布永久降价至 1/4: https://weibo.com/1649173367/R0KaFjwie
[6] 七九三一 (微博) - V4 永久降价的原因分析（FP4 + 昇腾 950）: https://weibo.com/1924762335/R0Dbwf5ol
[7] 满仓马哥 (微博) - 国家发改委 5/22 发声 + V4 Day 0 适配 8 家国产芯片: https://weibo.com/2130288305/R0BeKtWQ5
[8] 36 氪 - 《老股暗流：谁在从中国大模型公司悄悄套现？》: https://36kr.com/p/3798664146017281
[9] 36 氪 - 《全球投资者正把大模型公司推向"市梦率"》: https://36kr.com/p/3748129288782343
[10] 36 氪 - 《大模型公司被曝卖身，多家美国 AI 创企裁员 20%，明星独角兽急寻"救命钱"》: https://36kr.com/p/2779541964293249
[11] 知乎 - 《大模型第一股交卷，智谱 3000 亿市值对应 31.82 亿元亏损》: https://www.zhihu.com/question/2023344323463312345/answer/2026343235996463451
[12] 知乎 - 《中国大模型，靠政府订单续命》/《算力寻租白热化，模型厂凛冬将至》/《大厂迷途：2 万亿砸下去，AI 账还没算明白》: https://zhuanlan.zhihu.com/p/1985822193876239543 / https://zhuanlan.zhihu.com/p/2019313559490799146 / https://zhuanlan.zhihu.com/p/2038071517938983503
[13] 维基百科 - History of commercial Unix vs Linux: https://en.wikipedia.org/wiki/History_of_Unix
[14] Simon Willison - DeepSeek V4 – almost on the frontier: https://simonwillison.net/2026/Apr/24/deepseek-v4/
[15] lmsys 博客 - DeepSeek-V4 on Day 0: From Fast Inference to Verified RL: https://www.lmsys.org/blog/2026-04-25-deepseek-v4/

文章中关于"W"的对话为基于公开素材重构的代表性场景，用于呈现行业普遍情况，不指向特定公司。

— @风远科技 / 2026.05.24