开放权重模型的地缘政治

创建时间: 2026-05-03 来源: [[sources/#490--state-of-ai-in-2026-llms-coding-scaling-laws-china-agents-gpus-agi|490 – State of AI in 2026 LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI]] 相关: US-China-AI-CompetitionState-of-AI-2026Nathan-LambertSebastian-RaschkaAI-Monetization-Market


背景:Llama 之后的真空

Meta 的 Llama 系列曾是美国开放模型的旗帜:

  • Llama 1/2/3 积累了大量社区热爱
  • 但 Llama 4 时期出了问题:
    • 高层追求”benchmaxing”——为基准测试过度优化,而非构建社区真正可用的模型
    • 内部政治斗争和激励错位
    • 大模型太大没人能跑,小模型反而没有
    • 社区负面反馈 → Meta 可能”赌气”退出开放模型
  • Mark Zuckerberg vs Alexander Wong(更反对开放源码)的内部辩论
  • Nathan 预测:不会有 Llama 5 开放权重版本

Llama 的教训

  • 开放模型的目标不是刷基准——是让人能用、信任、修改、理解
  • benchmaxing 毁掉了品牌

Atom Project(American Truly Open Models)

Nathan Lambert 2025 年 7 月发起。

核心论点

  1. 开放模型是 AI 研究的引擎——所有研究者从开放模型起步
  2. 如果最好的开放模型来自中国 → 最好的研究发生在中国模型之上
  3. 美国应投入 ~$1 亿构建超越闭源前沿半代的开放模型——对大公司微不足道

背景数据

  • 2025 年 7 月:4-5 个 DeepSeek 级别的中国开放模型,美国为零
  • 中国模型在美国企业中的使用率持续上升(因安全限制无法直接购买中国 API → 用开放权重绕过)

政策进展

  • AI2 获 NSF $1 亿资助——有史以来最大 CS 类 NSF 拨款
  • NVIDIA Jensen Huang 公开呼吁开放模型的紧迫性,Nemetron 模型更受重视
  • Reflection AI 的 $20 亿融资明确用于构建美国开放模型
  • 白宫 AI Action Plan 包含”Encourage Open Source and Open Web AI”专节
  • 签署参与的机构涵盖政策、技术、产业全栈

对”禁止开放模型”论的反驳

  • 禁止需要美国建立自己的”长城防火墙”——已知不可行且效果差
  • 训练 $1-1 亿模型的成本对全世界太多人可及——你无法阻止
  • 如果限制开放模型 → 美国自缚手脚、把领导权让给外国对手
  • “这些模型将被全世界训练”

开放 vs 闭源的深层动态

开放模型的价值

  • 透明性:安全审计的基础
  • 教育:下一代研究者的培养——如果没有开放模型,只有加入公司后才能学习
  • 定制化:企业在自有数据上的专业化
  • 竞争压力:中国模型的高质量反过来鼓励美国公司发布更好的模型

闭源模型的优势

  • 更大的计算资源
  • 深度集成特定工具的体验(如 Claude Code 的 Git/CLI 集成)
  • 安全可控——可以做更多安全测试后再发布
  • 闭源比开放”领先一代”——GPT-OSS 可能不是最前沿模型

互补而非替代

  • 开放模型不一定要在所有维度上击败闭源——只需要足够好、足够可及
  • Nathan:“美国公司在发布前对安全性有更多考量——看到 DeepSeek 等中国模型大规模使用无安全问题 → 鼓励他们也发布更强的开放模型”

长期展望

开放模型会统治世界吗?

取决于技术进步是否饱和:

  • 如果几年内饱和:开放模型会因为更多人优化而变得极便宜 → 赢家
  • 如果持续进步:闭源可能维持领先,因为需要巨额算力

10 年后

  • Nathan 不认为会有赢家通吃——除非有人发现真正的算法秘密
  • 更可能像 AWS / Azure / GCP 的格局——多家共存
  • AI 公司可能成为”API 工具”——像 AWS 一样
  • 但也可能上移做产品(因为 API 利润不足)

曼哈顿计划?

  • Lex 提到 AI 2027 报告中的”曼哈顿化”场景——国家安全原因集中化
  • Nathan 和 Sebastian 都认为短期内不可能也不可取
  • 但 Nathan 承认:曼哈顿计划式的开放模型投资”其实成本不高,可能合理”

参考资料

  • 来源:Lex Fridman Podcast #490
  • 关键项目:Atom Project (americantrulyopenmodels.org)
  • 关键人物:Nathan Lambert、Jensen Huang、Mark Zuckerberg