2026-05-24DeepSeek大模型行业观察

DeepSeek V4 发布后,没人统计过的那一栏数字:被欢呼声压死的人

V4 没有屠杀任何中国大模型公司,它做的是把『所有人都能做大模型』这件事的幻觉按下了刹车——而这恰恰是过去三年最稀缺的健康信号。

4 月 24 日,DeepSeek 把 1.6 万亿参数的 V4-Pro 推到了 Hugging Face。 一个月后的 5 月 23 日,他们宣布:把这个全球最便宜的旗舰模型,再永久降价到原价的 1/4。 同一周,36 氪的标题是《老股暗流:谁在从中国大模型公司悄悄套现?》。 这两件事,不是巧合。

封面图


核心洞察

DeepSeek V4 没有屠杀任何中国大模型公司。 它做的,是把"所有人都能做大模型"这件事的幻觉,按下了刹车。

——这恰恰是过去三年最稀缺的健康信号。


一、技术深潜:V4 到底"恐怖"在哪

先把事实摆出来 [1][2][3]:

项目 DeepSeek V4-Pro DeepSeek V4-Flash
总参数 1.6 万亿 (MoE) 2840 亿 (MoE)
激活参数 49B / token 13B / token
上下文 100 万 token 100 万 token
License MIT (完全开源) MIT (完全开源)
跑分 Artificial Analysis Quality Index 52,开源权重第二
对标 GPT-5.5 / Claude Opus 4.7
发布时间 2026 / 04 / 24 同上

然而真正让全球同行倒吸一口冷气的,不是 1.6T 的参数,而是下面这三个数字。

1.1 显存压缩的奠基性贡献

在 100 万 token 的上下文深度下 [4]:

  • DeepSeek V4-Pro:5.48 GB HBM
  • GLM5(约 7000 亿参数):60 GB HBM
  • Qwen3-235B-A22B(约 2350 亿参数):89 GB HBM

V4-Pro 的参数量比 GLM5 多 2 倍多,显存占用只有它的 1/11。 比 Qwen3-235B 的 6.8 倍参数量,显存占用只有它的 1/16

这意味着什么?意味着「长程 AI 智能体」(Long-horizon Agents)的部署成本一夜之间塌方。一个原本需要 8 张 H200 才能跑起来的百万 token 推理,现在可能 1 张就够了。

1.2 价格的"斩杀线"

5 月 23 日,DeepSeek 官方宣布 [5]:

DeepSeek-V4-Pro API 价格将于 2026/05/31 23:59 结束 2.5 折优惠后,正式调整为原定价的 1/4

具体定价:

  • 输入(缓存命中):0.025 元 / 百万 tokens
  • 输入(缓存未命中):3 元 / 百万 tokens
  • 输出:6 元 / 百万 tokens

这是全球大模型的新地板。 一位微博用户的总结很传神——"Codex、Claude 定义目标线,DeepSeek 定义斩杀线。"

1.3 FP4 + 昇腾 950 的算力闭环

V4 的训练里用了 FP4 量化感知训练,专家权重和后训练直接走 FP4 精度 [6]。这对国产昇腾 950 系列芯片是"原生友好"——950 的 FP4 算力 1.56-2P,跑 FP4 模型的实际算力达到 H200 量级。卡间互联带宽 2 TB/s,超过 H200 的 900 GB/s。

V4 在发布首日完成对华为昇腾、寒武纪等 8 家国产芯片的 Day 0 适配 [7]。5 月 22 日,国家发改委正式发声:将指导国产大模型加大力度适配国产算力芯片 [7]。

到这里,技术层的故事可以收一收了——这是一个**"算法-硬件-政策"形成正循环**的样本,对整个中国 AI 产业链是利好。


二、至暗时刻:聚光灯之外的那一栏

现在请把镜头从北京中关村南五街转到任何一家中国 To B 大模型创业公司的会议室里。

2.1 "老股暗流"和"市梦率"

5 月以来,36 氪连续刊出几篇标题极重的稿子 [8][9][10]:

  • 《老股暗流:谁在从中国大模型公司悄悄套现?》
  • 《全球投资者正把大模型公司推向"市梦率"》
  • 《大模型公司被曝卖身,多家美国 AI 创企裁员 20%,明星独角兽急寻"救命钱"》

「老股」是创业圈的暗号——指早期投资人通过场外二级市场把股权悄悄转手。它出现的时点,往往比公司公告的爆雷早 6-12 个月

2.2 智谱:3000 亿市值,对应 31.82 亿亏损

作为 A 股「大模型第一股」的智谱,最新一期财报对应 3000 亿市值 / 31.82 亿元年度亏损 [11]。

这是中国大模型公司里最体面的财务表现之一——已经上市、有政府订单、有大客户名单。但 3000 亿市值的支撑,是「未来 3 年商业化跑通」这件事——而 V4 的发布,把"商业化跑通"这件事的难度系数往上抬了一个量级。

2.3 "靠政府订单续命"

知乎热门答主在 5 月写下 [12]:

"中国大模型,靠政府订单续命。"

"算力寻租白热化,模型厂凛冬将至。"

"大厂迷途:2 万亿砸下去,AI 账还没算明白。"

这些标题没有任何夸张。把 V4-Pro 的 0.025 元/百万 token 摆出来,再问任何一家正在做 To B 私有化部署、报价数百万一年的大模型公司——你们的差异化在哪?

答案大多数时候是沉默。

2.4 一个不能写出名字的对话

跟一位某中型大模型公司的朋友通话(他要求匿名,下文称 W)。

W 说:「4 月 25 日上午,我们临时开会,把下季度的 BP 里那一页写着『模型层差异化』的 PPT,撤了。」

「不是 V4 太强。是 V4 的价格,把『自研基座模型 + 私有部署』这条路线的财务模型,直接证伪了。」

「我们花了两年时间训出来的东西,现在我们自己 API 调 V4 接进去都比卖给客户便宜。」

「不是输给了 DeepSeek。是被它的开源 + 免费给拽到了同一个起跑线上——而那条起跑线,我们没有任何优势。」


三、历史同构:开源大杀器一出,谁会被洗掉

这件事不是第一次发生。把镜头拉远 30 年,Linux 出现之前,全球商业 Unix 厂商是这样的版图 [13]:

  • Sun Microsystems(Solaris)
  • SCO(OpenServer / UnixWare)
  • SGI(IRIX)
  • HP(HP-UX)
  • IBM(AIX)

Linux 1991 年发布。一开始所有商业 Unix 厂商都笑——"一个学生玩具,撼动不了我们的企业市场"。

2010 年回头看:

  • SCO 已死(破产)
  • SGI 已死(被收购)
  • Sun 被 Oracle 收购,Solaris 几近停摆
  • HP-UX 仅存于历史包袱里
  • 只有 IBM 转型成功(AIX → Power 架构 + 服务)

这不是 Linux 的"屠杀"。这是商业生态对"差异化幻觉"的一次大型出清。

把这段历史叠到 2026 年的中国大模型生态上:DeepSeek 是那个 Linus,V4 是那次 1.0 跨过门槛的时刻——它不会让所有人死,但会让"只有基座模型、没有应用层、没有用户、没有差异化"的中腰部公司,集体进入一段非常难熬的找路过程。


四、数据罗盘:被压死的人不会有讣告

中国大模型创业公司的"凋零",从来不是新闻——是几件事的合集:

  1. 老股流动率上升(早期投资人套现)
  2. 招聘冻结 + 安静裁员(保留品牌)
  3. 转型 To G、To 私有云、To 行业 SaaS
  4. 卖身大厂(最常见的"软着陆")
  5. 大轮融资延迟 / 估值不变继续融

这些动作都不会上头条。但它们正在中国大模型公司里同时发生。这就是"被欢呼声压死的人"的真实样子——不是一夜暴毙,是 18 个月的安静凋零

V4 的发布只是把这个进程加速了 6 个月。


五、一句话收束

我们这一代人会习惯一种新现象:所有伟大技术的发布会,台下都站着一群不能哭出声来的人

V4 是 2026 年开源 AI 的一座里程碑。 而里程碑的另一面,永远是 18 个月后才会被写进 36 氪头条 的那张「悄悄消失的公司名单」。

中国大模型行业不再需要那么多基座模型公司了——V4 替我们做了第一次出清。 活下来的人,不是因为模型更强,是因为早就把模型当成了基础设施,把价值往应用层、行业层、Agent 层迁移

那一栏没有人统计过的数字,会在 2027 年的某个夏天被人重写。 而今天,所有人都在为 V4 鼓掌


资讯来源


文章中关于"W"的对话为基于公开素材重构的代表性场景,用于呈现行业普遍情况,不指向特定公司。

— @风远科技 / 2026.05.24

想聊聊你企业的 AI 落地路径?

杭州风远科技有限公司已为 500+ 中小企业和 50+ 大型央国企提供 AI 落地服务,欢迎深入交流。