AI 的当前现实

创建时间: 2026-05-03 来源: [[sources/Some Notes on AI.md]] 相关: Karri-SaarinenVibe-Coding-to-Agentic-EngineeringJagged-IntelligenceAgent-Paradigm-ShiftVibe-Coding-in-Prod


“The capabilities are real, but so are the limits.” — Karri Saarinen

Karri Saarinen 对 AI 当前状态的七个核心观察。发表于 2026 年 4 月,距上一次模型编码能力大幅提升约半年——他认为六个月往往是”蜜月期”,之后现实开始显现。

1. 规划悖论:计划无用,规划万能

“Plans are worthless, but planning is everything.”

AI 时代规划似乎正在过时。但 Saarinen 追问:规划到底在解决什么问题?

规划的价值不在产出(计划文档),而在于:

  • 对齐:迫使组织坐下来辩论什么是真正重要的
  • 承诺:决定优先级,建立共识
  • 共享地形:为各部门提供可协调的参考框架
  • 预处理复杂性:提前暴露组织边界和协作难点

AI 确实改变了时间线和带宽,但没有解决选择的问题。事实上,建造成本下降让选择更重要了——越容易造东西,越容易造错东西。

与 vibe coding 的关系: Vibe-Coding-to-Agentic-Engineering 中 Karpathy 也强调”战略方向”不可外包。两者共同指向:AI 放大执行,但不替代判断。

2. AI 驾驭 vs 被 AI 驾驭

“Tools always steer and influence workflows.”

所有工具都会引导工作流,但 AI 不同——它是思考工具,不只是机械工具,引导力远超从前。

存在一种合理的工作流:不与 AI 对抗,而是顺势而为——承认模型有方向,利用这个动量。这就是 vibe coding 做得好的形态。

但问题是:顺势而为可能不在你真正想去的方向上。 不思考方向、不做规划、只看什么容易做,你就可能被 AI 引向最容易的路径,而非最有价值的路径。

3. 专业能力悖论

“AI often feels most impressive in domains where you know the least.”

这是市场认知撕裂的最大来源:

认知水平对 AI 输出的感受
外行”魔法!无限可能!“
专家”差一点。缺上下文,选了显而易见的路径。”

本质是 Gell-Mann Amnesia + Dunning-Kruger 的规模化:在你不懂的领域,你缺乏判断缺失的能力,所以看起来完美。

悖论在于:专业能力让 AI 更难用,但也更有价值——前提是你知道如何驾驭它。AI 没有消除专业能力的价值,而是将专业能力重新定义为方向感、判断力、知道什么是好的

Jagged-Intelligence 高度相关:Karpathy 的”锯齿智能”框架指出 LLM 在可验证任务上表现强、不可验证任务上表现弱——这正是”专家能看到缺陷”的技术原因。

4. 编程 Agent 的现实光谱

行业现状(2026 年初):

  • Agentic coding 已成行业标配
  • 但几乎没有人私下说 agent 写了 100% 的代码
  • 也没听到太多来自真实公司的大规模独立 agent swarm 故事
  • 工程师仍在深度参与,通常同时运行少数 agent + 几个后台云 agent

Linear 的数据:

  • 多数付费工作区已安装编程 Agent
  • Agent 使用量几个月内增长 5 倍以上
  • 云编程 agent 月修复 1000+ issues,且快速增长
  • 核心价值:带宽扩展——那些太小、太烦、太耗时的问题现在可以解决了

硬问题依然硬。 Agentic coding 的价值通常不是”AI 写代码你接受”,而是:

  • 探索方案
  • 搭建脚手架
  • 调试错误
  • 重构代码
  • 编写测试或大规模迁移
  • 处理较小的修复

专家仍然提供品味、约束和最终判断。

Agent-Paradigm-Shift 呼应:Agent 范式转移已成为共识,但落地形态仍高度依赖人的参与。

5. AI 设计的迭代困境

图像生成能力大幅提升,但 迭代越多越崩溃

  • 难以让 AI 只改变一个特定的点,它往往同时改变很多东西
  • 每次迭代似乎在整张图上叠加一层”滤镜”
  • 可能需要开新聊天、写新描述、上传新文件才能修复
  • 同样的问题也出现在写作中——要求改一个地方,模型重新塑造整篇文章

核心需求: 需要更好的空间控制工具——让 AI 只作用于特定区域,而非每次都重新诠释整个输出。

6. 设计 ≠ 生产代码

Saarinen 对”设计工具直接操作生产代码库”的流行叙事提出质疑:

  • 设计工作大量是决策和探索,不是最终实现
  • 不应让每个改动都承担生产代码的速度或 token 成本
  • 不想因为 prompt 不完整就遇到报错
  • 设计是视觉领域,视觉画布工具仍然最有效

更理想的方向:

  1. 语义化 UI 设计工具——画的不是矩形,而是”模态框”,能继承系统某些属性
  2. AI 帮助填充屏幕、生成变体、探索方向——价值在模式,不在模式背后的生产代码
  3. 设计完成后,有清晰的工作流将设计文件交给 AI 转译为代码

“In the AI world, design is like planning for me.”

7. 领域决定一切

不同产品需要完全不同层次的稳定性、信任、安全和设计:

产品类型需求特征
高频触觉工具(如邮件)大量 UX 打磨,小摩擦会累积
后端服务UI 可粗糙,价值在逻辑

许多 AI 公司更像后端公司:能力在模型,工具层在模型之上迭代,视觉/概念足迹很小。这更接近经典 UNIX 系统——程序独立创建、运行时组合,可组合性高于现代 macOS。

结语:观察、尝试、保持判断

“If potential were revenue, all this CapEx would already be profit.”

Saarinen 的立场是审慎的现实主义

  • 能力在变,但不能靠”相信”来建造
  • 需要更真实地观察当下的可能
  • 决定什么值得做
  • 随现实变化而调整

衍生创作

参考资料