中美 AI 竞争格局

创建时间： 2026-05-03 来源： [[sources/#490--state-of-ai-in-2026-llms-coding-scaling-laws-china-agents-gpus-agi|490 – State of AI in 2026 LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI]] 相关： Open-Weight-Models-Geopolitics，State-of-AI-2026，AI-Monetization-Market，Nathan-Lambert，Sebastian-Raschka

DeepSeek 时刻

2025 年 1 月，DeepSeek 发布 R1——以远低于西方同行的算力和成本达到前沿性能。这一事件在 AI 行业引发震动，被称为”DeepSeek 时刻”。

DeepSeek 的特殊性

背后是对冲基金 High Flyer Capital——资金来源不同于一般创业公司
非常保密（不公开内部运营）但技术报告完全公开
预训练成本：论文报告 ~ $500 万，实际含工程调试约$ 200 万（论文 Section 2.4 详述）

中国 AI 生态的爆发

DeepSeek 引爆了一场运动——类似 ChatGPT 在美国引发的 chatbot 潮：

公司	特点
DeepSeek	对冲基金背景，秘密运营，技术报告公开
Z.ai（GLM）	已提交 IPO 文件，寻求西方市场影响力
Minimax	已提交 IPO 文件，积极进行西方外联
Moonshot（Kimi）	使用与 DeepSeek 相同架构，近期表现亮眼

Nathan 的判断

“DeepSeek 正在失去王冠——不是因为变差，而是因为竞争者用它的想法追了上来”
2026 年将有更多中国开放模型构建者——整合预计不会在 2026 年发生
不同公司有不同动机——影响模型开发和沟通策略

美国闭源模型格局

公司	优势	劣势
Anthropic	代码专精、文化一致性、最少混乱	依赖代码生态
OpenAI	定义范式的能力（o1、GPT-5 路由器）	运营混乱、996
Google	TPU + 数据中心 + 规模	品牌认知度相对较低

Nathan 的预测

Gemini 将继续蚕食 ChatGPT 份额——Google 的规模和研究/产品分离能力是优势
Anthropic 在软件和企业领域将继续成功
OpenAI 总是在着陆——很难押注他们失败（尽管运营混乱）

关键洞察

”蛙跳”式竞争

“最新模型永远是最好的”——这种蛙跳将持续
不是因为某个公司变差了，而是因为其他公司用相同想法追上来
结论：不会有赢家通吃

为什么没人从用户角度使用中国模型？

播客中三位都用 OpenAI/Anthropic/Google 的产品
解释：模型 ≠ 平台——中国模型以开放权重闻名，而非平台
美国模型目前在输出质量上确实更好
中国模型服务方式可能使用更少 GPU（→ 更慢、不同类型的错误）

中国公司为什么发布开放权重？

美国企业因安全顾虑不会购买中国 API 订阅
开放权重 = 影响力通道——绕过安全限制，参与美国 AI 支出市场
中国政府看到国际影响力 → 激励继续支持
预计将持续数年——至少 2026 年会有更多

用户使用模式的启示

多订阅未来

工作用一个（干净，无个人数据），个人用一个
不同任务用不同模型——Nathan 用 ChatGPT (thinking) 查信息、Gemini 快速查询、Claude 代码/哲学讨论、Grok 实时信息
“用到出问题为止，然后换”——和浏览器一样

模型忠诚度的脆弱性

一个功能赢得你的心 → 你爱上这个模型
一个蠢行为 → 你立刻切换
阈值效应——和产品忠诚度一样脆弱

参考资料

来源：Lex Fridman Podcast #490
关键人物：Sebastian Raschka、Nathan Lambert
相关：Open-Weight-Models-Geopolitics（开放模型的地缘政治维度）

Notes Wiki

Explorer

US-China-AI-Competition