AI 的当前现实
创建时间: 2026-05-03
来源: [[sources/Some Notes on AI.md]]
相关: Karri-Saarinen,Vibe-Coding-to-Agentic-Engineering,Jagged-Intelligence,Agent-Paradigm-Shift,Vibe-Coding-in-Prod
“The capabilities are real, but so are the limits.” — Karri Saarinen
Karri Saarinen 对 AI 当前状态的七个核心观察。发表于 2026 年 4 月,距上一次模型编码能力大幅提升约半年——他认为六个月往往是”蜜月期”,之后现实开始显现。
1. 规划悖论:计划无用,规划万能
“Plans are worthless, but planning is everything.”
AI 时代规划似乎正在过时。但 Saarinen 追问:规划到底在解决什么问题?
规划的价值不在产出(计划文档),而在于:
- 对齐:迫使组织坐下来辩论什么是真正重要的
- 承诺:决定优先级,建立共识
- 共享地形:为各部门提供可协调的参考框架
- 预处理复杂性:提前暴露组织边界和协作难点
AI 确实改变了时间线和带宽,但没有解决选择的问题。事实上,建造成本下降让选择更重要了——越容易造东西,越容易造错东西。
与 vibe coding 的关系: Vibe-Coding-to-Agentic-Engineering 中 Karpathy 也强调”战略方向”不可外包。两者共同指向:AI 放大执行,但不替代判断。
2. AI 驾驭 vs 被 AI 驾驭
“Tools always steer and influence workflows.”
所有工具都会引导工作流,但 AI 不同——它是思考工具,不只是机械工具,引导力远超从前。
存在一种合理的工作流:不与 AI 对抗,而是顺势而为——承认模型有方向,利用这个动量。这就是 vibe coding 做得好的形态。
但问题是:顺势而为可能不在你真正想去的方向上。 不思考方向、不做规划、只看什么容易做,你就可能被 AI 引向最容易的路径,而非最有价值的路径。
3. 专业能力悖论
“AI often feels most impressive in domains where you know the least.”
这是市场认知撕裂的最大来源:
| 认知水平 | 对 AI 输出的感受 |
|---|---|
| 外行 | ”魔法!无限可能!“ |
| 专家 | ”差一点。缺上下文,选了显而易见的路径。” |
本质是 Gell-Mann Amnesia + Dunning-Kruger 的规模化:在你不懂的领域,你缺乏判断缺失的能力,所以看起来完美。
悖论在于:专业能力让 AI 更难用,但也更有价值——前提是你知道如何驾驭它。AI 没有消除专业能力的价值,而是将专业能力重新定义为方向感、判断力、知道什么是好的。
与 Jagged-Intelligence 高度相关:Karpathy 的”锯齿智能”框架指出 LLM 在可验证任务上表现强、不可验证任务上表现弱——这正是”专家能看到缺陷”的技术原因。
4. 编程 Agent 的现实光谱
行业现状(2026 年初):
- Agentic coding 已成行业标配
- 但几乎没有人私下说 agent 写了 100% 的代码
- 也没听到太多来自真实公司的大规模独立 agent swarm 故事
- 工程师仍在深度参与,通常同时运行少数 agent + 几个后台云 agent
Linear 的数据:
- 多数付费工作区已安装编程 Agent
- Agent 使用量几个月内增长 5 倍以上
- 云编程 agent 月修复 1000+ issues,且快速增长
- 核心价值:带宽扩展——那些太小、太烦、太耗时的问题现在可以解决了
硬问题依然硬。 Agentic coding 的价值通常不是”AI 写代码你接受”,而是:
- 探索方案
- 搭建脚手架
- 调试错误
- 重构代码
- 编写测试或大规模迁移
- 处理较小的修复
专家仍然提供品味、约束和最终判断。
与 Agent-Paradigm-Shift 呼应:Agent 范式转移已成为共识,但落地形态仍高度依赖人的参与。
5. AI 设计的迭代困境
图像生成能力大幅提升,但 迭代越多越崩溃:
- 难以让 AI 只改变一个特定的点,它往往同时改变很多东西
- 每次迭代似乎在整张图上叠加一层”滤镜”
- 可能需要开新聊天、写新描述、上传新文件才能修复
- 同样的问题也出现在写作中——要求改一个地方,模型重新塑造整篇文章
核心需求: 需要更好的空间控制工具——让 AI 只作用于特定区域,而非每次都重新诠释整个输出。
6. 设计 ≠ 生产代码
Saarinen 对”设计工具直接操作生产代码库”的流行叙事提出质疑:
- 设计工作大量是决策和探索,不是最终实现
- 不应让每个改动都承担生产代码的速度或 token 成本
- 不想因为 prompt 不完整就遇到报错
- 设计是视觉领域,视觉画布工具仍然最有效
更理想的方向:
- 语义化 UI 设计工具——画的不是矩形,而是”模态框”,能继承系统某些属性
- AI 帮助填充屏幕、生成变体、探索方向——价值在模式,不在模式背后的生产代码
- 设计完成后,有清晰的工作流将设计文件交给 AI 转译为代码
“In the AI world, design is like planning for me.”
7. 领域决定一切
不同产品需要完全不同层次的稳定性、信任、安全和设计:
| 产品类型 | 需求特征 |
|---|---|
| 高频触觉工具(如邮件) | 大量 UX 打磨,小摩擦会累积 |
| 后端服务 | UI 可粗糙,价值在逻辑 |
许多 AI 公司更像后端公司:能力在模型,工具层在模型之上迭代,视觉/概念足迹很小。这更接近经典 UNIX 系统——程序独立创建、运行时组合,可组合性高于现代 macOS。
结语:观察、尝试、保持判断
“If potential were revenue, all this CapEx would already be profit.”
Saarinen 的立场是审慎的现实主义:
- 能力在变,但不能靠”相信”来建造
- 需要更真实地观察当下的可能
- 决定什么值得做
- 随现实变化而调整
衍生创作
- morning-journal-ai-pricing-shift — 博客/晨记:从 Karri 的专业能力悖论出发,推演 Agent 时代用户用脚投票
参考资料
- 来源:Some Notes on AI(Karri Saarinen, 2026-04-26)