中美 AI 竞争格局

创建时间: 2026-05-03 来源: [[sources/#490--state-of-ai-in-2026-llms-coding-scaling-laws-china-agents-gpus-agi|490 – State of AI in 2026 LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI]] 相关: Open-Weight-Models-GeopoliticsState-of-AI-2026AI-Monetization-MarketNathan-LambertSebastian-Raschka


DeepSeek 时刻

2025 年 1 月,DeepSeek 发布 R1——以远低于西方同行的算力和成本达到前沿性能。这一事件在 AI 行业引发震动,被称为”DeepSeek 时刻”。

DeepSeek 的特殊性

  • 背后是对冲基金 High Flyer Capital——资金来源不同于一般创业公司
  • 非常保密(不公开内部运营)但技术报告完全公开
  • 预训练成本:论文报告 ~200 万(论文 Section 2.4 详述)

中国 AI 生态的爆发

DeepSeek 引爆了一场运动——类似 ChatGPT 在美国引发的 chatbot 潮:

公司特点
DeepSeek对冲基金背景,秘密运营,技术报告公开
Z.ai(GLM)已提交 IPO 文件,寻求西方市场影响力
Minimax已提交 IPO 文件,积极进行西方外联
Moonshot(Kimi)使用与 DeepSeek 相同架构,近期表现亮眼

Nathan 的判断

  • “DeepSeek 正在失去王冠——不是因为变差,而是因为竞争者用它的想法追了上来”
  • 2026 年将有更多中国开放模型构建者——整合预计不会在 2026 年发生
  • 不同公司有不同动机——影响模型开发和沟通策略

美国闭源模型格局

公司优势劣势
Anthropic代码专精、文化一致性、最少混乱依赖代码生态
OpenAI定义范式的能力(o1、GPT-5 路由器)运营混乱、996
GoogleTPU + 数据中心 + 规模品牌认知度相对较低

Nathan 的预测

  • Gemini 将继续蚕食 ChatGPT 份额——Google 的规模和研究/产品分离能力是优势
  • Anthropic 在软件和企业领域将继续成功
  • OpenAI 总是在着陆——很难押注他们失败(尽管运营混乱)

关键洞察

”蛙跳”式竞争

  • “最新模型永远是最好的”——这种蛙跳将持续
  • 不是因为某个公司变差了,而是因为其他公司用相同想法追上来
  • 结论:不会有赢家通吃

为什么没人从用户角度使用中国模型?

  • 播客中三位都用 OpenAI/Anthropic/Google 的产品
  • 解释:模型 ≠ 平台——中国模型以开放权重闻名,而非平台
  • 美国模型目前在输出质量上确实更好
  • 中国模型服务方式可能使用更少 GPU(→ 更慢、不同类型的错误)

中国公司为什么发布开放权重?

  • 美国企业因安全顾虑不会购买中国 API 订阅
  • 开放权重 = 影响力通道——绕过安全限制,参与美国 AI 支出市场
  • 中国政府看到国际影响力 → 激励继续支持
  • 预计将持续数年——至少 2026 年会有更多

用户使用模式的启示

多订阅未来

  • 工作用一个(干净,无个人数据),个人用一个
  • 不同任务用不同模型——Nathan 用 ChatGPT (thinking) 查信息、Gemini 快速查询、Claude 代码/哲学讨论、Grok 实时信息
  • “用到出问题为止,然后换”——和浏览器一样

模型忠诚度的脆弱性

  • 一个功能赢得你的心 → 你爱上这个模型
  • 一个蠢行为 → 你立刻切换
  • 阈值效应——和产品忠诚度一样脆弱

参考资料

  • 来源:Lex Fridman Podcast #490
  • 关键人物:Sebastian Raschka、Nathan Lambert
  • 相关:Open-Weight-Models-Geopolitics(开放模型的地缘政治维度)