4 月 24 日,DeepSeek 把 1.6 万亿参数的 V4-Pro 推到了 Hugging Face。 一个月后的 5 月 23 日,他们宣布:把这个全球最便宜的旗舰模型,再永久降价到原价的 1/4。 同一周,36 氪的标题是《老股暗流:谁在从中国大模型公司悄悄套现?》。 这两件事,不是巧合。

核心洞察
DeepSeek V4 没有屠杀任何中国大模型公司。 它做的,是把"所有人都能做大模型"这件事的幻觉,按下了刹车。
——这恰恰是过去三年最稀缺的健康信号。
一、技术深潜:V4 到底"恐怖"在哪
先把事实摆出来 [1][2][3]:
| 项目 | DeepSeek V4-Pro | DeepSeek V4-Flash |
|---|---|---|
| 总参数 | 1.6 万亿 (MoE) | 2840 亿 (MoE) |
| 激活参数 | 49B / token | 13B / token |
| 上下文 | 100 万 token | 100 万 token |
| License | MIT (完全开源) | MIT (完全开源) |
| 跑分 | Artificial Analysis Quality Index 52,开源权重第二 | — |
| 对标 | GPT-5.5 / Claude Opus 4.7 | — |
| 发布时间 | 2026 / 04 / 24 | 同上 |
然而真正让全球同行倒吸一口冷气的,不是 1.6T 的参数,而是下面这三个数字。
1.1 显存压缩的奠基性贡献
在 100 万 token 的上下文深度下 [4]:
- DeepSeek V4-Pro:5.48 GB HBM
- GLM5(约 7000 亿参数):60 GB HBM
- Qwen3-235B-A22B(约 2350 亿参数):89 GB HBM
V4-Pro 的参数量比 GLM5 多 2 倍多,显存占用只有它的 1/11。 比 Qwen3-235B 的 6.8 倍参数量,显存占用只有它的 1/16。
这意味着什么?意味着「长程 AI 智能体」(Long-horizon Agents)的部署成本一夜之间塌方。一个原本需要 8 张 H200 才能跑起来的百万 token 推理,现在可能 1 张就够了。
1.2 价格的"斩杀线"
5 月 23 日,DeepSeek 官方宣布 [5]:
DeepSeek-V4-Pro API 价格将于 2026/05/31 23:59 结束 2.5 折优惠后,正式调整为原定价的 1/4。
具体定价:
- 输入(缓存命中):0.025 元 / 百万 tokens
- 输入(缓存未命中):3 元 / 百万 tokens
- 输出:6 元 / 百万 tokens
这是全球大模型的新地板。 一位微博用户的总结很传神——"Codex、Claude 定义目标线,DeepSeek 定义斩杀线。"
1.3 FP4 + 昇腾 950 的算力闭环
V4 的训练里用了 FP4 量化感知训练,专家权重和后训练直接走 FP4 精度 [6]。这对国产昇腾 950 系列芯片是"原生友好"——950 的 FP4 算力 1.56-2P,跑 FP4 模型的实际算力达到 H200 量级。卡间互联带宽 2 TB/s,超过 H200 的 900 GB/s。
V4 在发布首日完成对华为昇腾、寒武纪等 8 家国产芯片的 Day 0 适配 [7]。5 月 22 日,国家发改委正式发声:将指导国产大模型加大力度适配国产算力芯片 [7]。
到这里,技术层的故事可以收一收了——这是一个**"算法-硬件-政策"形成正循环**的样本,对整个中国 AI 产业链是利好。
二、至暗时刻:聚光灯之外的那一栏
现在请把镜头从北京中关村南五街转到任何一家中国 To B 大模型创业公司的会议室里。
2.1 "老股暗流"和"市梦率"
5 月以来,36 氪连续刊出几篇标题极重的稿子 [8][9][10]:
- 《老股暗流:谁在从中国大模型公司悄悄套现?》
- 《全球投资者正把大模型公司推向"市梦率"》
- 《大模型公司被曝卖身,多家美国 AI 创企裁员 20%,明星独角兽急寻"救命钱"》
「老股」是创业圈的暗号——指早期投资人通过场外二级市场把股权悄悄转手。它出现的时点,往往比公司公告的爆雷早 6-12 个月。
2.2 智谱:3000 亿市值,对应 31.82 亿亏损
作为 A 股「大模型第一股」的智谱,最新一期财报对应 3000 亿市值 / 31.82 亿元年度亏损 [11]。
这是中国大模型公司里最体面的财务表现之一——已经上市、有政府订单、有大客户名单。但 3000 亿市值的支撑,是「未来 3 年商业化跑通」这件事——而 V4 的发布,把"商业化跑通"这件事的难度系数往上抬了一个量级。
2.3 "靠政府订单续命"
知乎热门答主在 5 月写下 [12]:
"中国大模型,靠政府订单续命。"
"算力寻租白热化,模型厂凛冬将至。"
"大厂迷途:2 万亿砸下去,AI 账还没算明白。"
这些标题没有任何夸张。把 V4-Pro 的 0.025 元/百万 token 摆出来,再问任何一家正在做 To B 私有化部署、报价数百万一年的大模型公司——你们的差异化在哪?
答案大多数时候是沉默。
2.4 一个不能写出名字的对话
跟一位某中型大模型公司的朋友通话(他要求匿名,下文称 W)。
W 说:「4 月 25 日上午,我们临时开会,把下季度的 BP 里那一页写着『模型层差异化』的 PPT,撤了。」
「不是 V4 太强。是 V4 的价格,把『自研基座模型 + 私有部署』这条路线的财务模型,直接证伪了。」
「我们花了两年时间训出来的东西,现在我们自己 API 调 V4 接进去都比卖给客户便宜。」
「不是输给了 DeepSeek。是被它的开源 + 免费给拽到了同一个起跑线上——而那条起跑线,我们没有任何优势。」
三、历史同构:开源大杀器一出,谁会被洗掉
这件事不是第一次发生。把镜头拉远 30 年,Linux 出现之前,全球商业 Unix 厂商是这样的版图 [13]:
- Sun Microsystems(Solaris)
- SCO(OpenServer / UnixWare)
- SGI(IRIX)
- HP(HP-UX)
- IBM(AIX)
Linux 1991 年发布。一开始所有商业 Unix 厂商都笑——"一个学生玩具,撼动不了我们的企业市场"。
2010 年回头看:
- SCO 已死(破产)
- SGI 已死(被收购)
- Sun 被 Oracle 收购,Solaris 几近停摆
- HP-UX 仅存于历史包袱里
- 只有 IBM 转型成功(AIX → Power 架构 + 服务)
这不是 Linux 的"屠杀"。这是商业生态对"差异化幻觉"的一次大型出清。
把这段历史叠到 2026 年的中国大模型生态上:DeepSeek 是那个 Linus,V4 是那次 1.0 跨过门槛的时刻——它不会让所有人死,但会让"只有基座模型、没有应用层、没有用户、没有差异化"的中腰部公司,集体进入一段非常难熬的找路过程。
四、数据罗盘:被压死的人不会有讣告
中国大模型创业公司的"凋零",从来不是新闻——是几件事的合集:
- 老股流动率上升(早期投资人套现)
- 招聘冻结 + 安静裁员(保留品牌)
- 转型 To G、To 私有云、To 行业 SaaS
- 卖身大厂(最常见的"软着陆")
- 大轮融资延迟 / 估值不变继续融
这些动作都不会上头条。但它们正在中国大模型公司里同时发生。这就是"被欢呼声压死的人"的真实样子——不是一夜暴毙,是 18 个月的安静凋零。
V4 的发布只是把这个进程加速了 6 个月。
五、一句话收束
我们这一代人会习惯一种新现象:所有伟大技术的发布会,台下都站着一群不能哭出声来的人。
V4 是 2026 年开源 AI 的一座里程碑。 而里程碑的另一面,永远是 18 个月后才会被写进 36 氪头条 的那张「悄悄消失的公司名单」。
中国大模型行业不再需要那么多基座模型公司了——V4 替我们做了第一次出清。 活下来的人,不是因为模型更强,是因为早就把模型当成了基础设施,把价值往应用层、行业层、Agent 层迁移。
那一栏没有人统计过的数字,会在 2027 年的某个夏天被人重写。 而今天,所有人都在为 V4 鼓掌。
资讯来源
- [1] HuggingFace - DeepSeek-V4-Pro 模型卡: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
- [2] DeepSeek V4 Technical Report (PDF): https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
- [3] DeepSeek V4 Preview Release 官方公告: https://api-docs.deepseek.com/news/news260424
- [4] DeepAgent (微博) - V4 在 100 万上下文下 HBM 占用对比: https://weibo.com/3301384190/R0SMcryrh
- [5] 每日经济新闻 - DeepSeek 宣布永久降价至 1/4: https://weibo.com/1649173367/R0KaFjwie
- [6] 七九三一 (微博) - V4 永久降价的原因分析(FP4 + 昇腾 950): https://weibo.com/1924762335/R0Dbwf5ol
- [7] 满仓马哥 (微博) - 国家发改委 5/22 发声 + V4 Day 0 适配 8 家国产芯片: https://weibo.com/2130288305/R0BeKtWQ5
- [8] 36 氪 - 《老股暗流:谁在从中国大模型公司悄悄套现?》: https://36kr.com/p/3798664146017281
- [9] 36 氪 - 《全球投资者正把大模型公司推向"市梦率"》: https://36kr.com/p/3748129288782343
- [10] 36 氪 - 《大模型公司被曝卖身,多家美国 AI 创企裁员 20%,明星独角兽急寻"救命钱"》: https://36kr.com/p/2779541964293249
- [11] 知乎 - 《大模型第一股交卷,智谱 3000 亿市值对应 31.82 亿元亏损》: https://www.zhihu.com/question/2023344323463312345/answer/2026343235996463451
- [12] 知乎 - 《中国大模型,靠政府订单续命》/《算力寻租白热化,模型厂凛冬将至》/《大厂迷途:2 万亿砸下去,AI 账还没算明白》: https://zhuanlan.zhihu.com/p/1985822193876239543 / https://zhuanlan.zhihu.com/p/2019313559490799146 / https://zhuanlan.zhihu.com/p/2038071517938983503
- [13] 维基百科 - History of commercial Unix vs Linux: https://en.wikipedia.org/wiki/History_of_Unix
- [14] Simon Willison - DeepSeek V4 – almost on the frontier: https://simonwillison.net/2026/Apr/24/deepseek-v4/
- [15] lmsys 博客 - DeepSeek-V4 on Day 0: From Fast Inference to Verified RL: https://www.lmsys.org/blog/2026-04-25-deepseek-v4/
文章中关于"W"的对话为基于公开素材重构的代表性场景,用于呈现行业普遍情况,不指向特定公司。
— @风远科技 / 2026.05.24