中美 AI 竞争格局
创建时间: 2026-05-03
来源: [[sources/#490--state-of-ai-in-2026-llms-coding-scaling-laws-china-agents-gpus-agi|490 – State of AI in 2026 LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI]]
相关: Open-Weight-Models-Geopolitics,State-of-AI-2026,AI-Monetization-Market,Nathan-Lambert,Sebastian-Raschka
DeepSeek 时刻
2025 年 1 月,DeepSeek 发布 R1——以远低于西方同行的算力和成本达到前沿性能。这一事件在 AI 行业引发震动,被称为”DeepSeek 时刻”。
DeepSeek 的特殊性
- 背后是对冲基金 High Flyer Capital——资金来源不同于一般创业公司
- 非常保密(不公开内部运营)但技术报告完全公开
- 预训练成本:论文报告 ~200 万(论文 Section 2.4 详述)
中国 AI 生态的爆发
DeepSeek 引爆了一场运动——类似 ChatGPT 在美国引发的 chatbot 潮:
| 公司 | 特点 |
|---|---|
| DeepSeek | 对冲基金背景,秘密运营,技术报告公开 |
| Z.ai(GLM) | 已提交 IPO 文件,寻求西方市场影响力 |
| Minimax | 已提交 IPO 文件,积极进行西方外联 |
| Moonshot(Kimi) | 使用与 DeepSeek 相同架构,近期表现亮眼 |
Nathan 的判断
- “DeepSeek 正在失去王冠——不是因为变差,而是因为竞争者用它的想法追了上来”
- 2026 年将有更多中国开放模型构建者——整合预计不会在 2026 年发生
- 不同公司有不同动机——影响模型开发和沟通策略
美国闭源模型格局
| 公司 | 优势 | 劣势 |
|---|---|---|
| Anthropic | 代码专精、文化一致性、最少混乱 | 依赖代码生态 |
| OpenAI | 定义范式的能力(o1、GPT-5 路由器) | 运营混乱、996 |
| TPU + 数据中心 + 规模 | 品牌认知度相对较低 |
Nathan 的预测
- Gemini 将继续蚕食 ChatGPT 份额——Google 的规模和研究/产品分离能力是优势
- Anthropic 在软件和企业领域将继续成功
- OpenAI 总是在着陆——很难押注他们失败(尽管运营混乱)
关键洞察
”蛙跳”式竞争
- “最新模型永远是最好的”——这种蛙跳将持续
- 不是因为某个公司变差了,而是因为其他公司用相同想法追上来
- 结论:不会有赢家通吃
为什么没人从用户角度使用中国模型?
- 播客中三位都用 OpenAI/Anthropic/Google 的产品
- 解释:模型 ≠ 平台——中国模型以开放权重闻名,而非平台
- 美国模型目前在输出质量上确实更好
- 中国模型服务方式可能使用更少 GPU(→ 更慢、不同类型的错误)
中国公司为什么发布开放权重?
- 美国企业因安全顾虑不会购买中国 API 订阅
- 开放权重 = 影响力通道——绕过安全限制,参与美国 AI 支出市场
- 中国政府看到国际影响力 → 激励继续支持
- 预计将持续数年——至少 2026 年会有更多
用户使用模式的启示
多订阅未来
- 工作用一个(干净,无个人数据),个人用一个
- 不同任务用不同模型——Nathan 用 ChatGPT (thinking) 查信息、Gemini 快速查询、Claude 代码/哲学讨论、Grok 实时信息
- “用到出问题为止,然后换”——和浏览器一样
模型忠诚度的脆弱性
- 一个功能赢得你的心 → 你爱上这个模型
- 一个蠢行为 → 你立刻切换
- 阈值效应——和产品忠诚度一样脆弱
参考资料
- 来源:Lex Fridman Podcast #490
- 关键人物:Sebastian Raschka、Nathan Lambert
- 相关:Open-Weight-Models-Geopolitics(开放模型的地缘政治维度)