AI 的当前现实

创建时间： 2026-05-03 来源： [[sources/Some Notes on AI.md]] 相关： Karri-Saarinen，Vibe-Coding-to-Agentic-Engineering，Jagged-Intelligence，Agent-Paradigm-Shift，Vibe-Coding-in-Prod

“The capabilities are real, but so are the limits.” — Karri Saarinen

Karri Saarinen 对 AI 当前状态的七个核心观察。发表于 2026 年 4 月，距上一次模型编码能力大幅提升约半年——他认为六个月往往是”蜜月期”，之后现实开始显现。

1. 规划悖论：计划无用，规划万能

“Plans are worthless, but planning is everything.”

AI 时代规划似乎正在过时。但 Saarinen 追问：规划到底在解决什么问题？

规划的价值不在产出（计划文档），而在于：

对齐：迫使组织坐下来辩论什么是真正重要的
承诺：决定优先级，建立共识
共享地形：为各部门提供可协调的参考框架
预处理复杂性：提前暴露组织边界和协作难点

AI 确实改变了时间线和带宽，但没有解决选择的问题。事实上，建造成本下降让选择更重要了——越容易造东西，越容易造错东西。

与 vibe coding 的关系： Vibe-Coding-to-Agentic-Engineering 中 Karpathy 也强调”战略方向”不可外包。两者共同指向：AI 放大执行，但不替代判断。

2. AI 驾驭 vs 被 AI 驾驭

“Tools always steer and influence workflows.”

所有工具都会引导工作流，但 AI 不同——它是思考工具，不只是机械工具，引导力远超从前。

存在一种合理的工作流：不与 AI 对抗，而是顺势而为——承认模型有方向，利用这个动量。这就是 vibe coding 做得好的形态。

但问题是：顺势而为可能不在你真正想去的方向上。 不思考方向、不做规划、只看什么容易做，你就可能被 AI 引向最容易的路径，而非最有价值的路径。

3. 专业能力悖论

“AI often feels most impressive in domains where you know the least.”

这是市场认知撕裂的最大来源：

认知水平	对 AI 输出的感受
外行	”魔法！无限可能！“
专家	”差一点。缺上下文，选了显而易见的路径。”

本质是 Gell-Mann Amnesia + Dunning-Kruger 的规模化：在你不懂的领域，你缺乏判断缺失的能力，所以看起来完美。

悖论在于：专业能力让 AI 更难用，但也更有价值——前提是你知道如何驾驭它。AI 没有消除专业能力的价值，而是将专业能力重新定义为方向感、判断力、知道什么是好的。

与 Jagged-Intelligence 高度相关：Karpathy 的”锯齿智能”框架指出 LLM 在可验证任务上表现强、不可验证任务上表现弱——这正是”专家能看到缺陷”的技术原因。

4. 编程 Agent 的现实光谱

行业现状（2026 年初）：

Agentic coding 已成行业标配
但几乎没有人私下说 agent 写了 100% 的代码
也没听到太多来自真实公司的大规模独立 agent swarm 故事
工程师仍在深度参与，通常同时运行少数 agent + 几个后台云 agent

Linear 的数据：

多数付费工作区已安装编程 Agent
Agent 使用量几个月内增长 5 倍以上
云编程 agent 月修复 1000+ issues，且快速增长
核心价值：带宽扩展——那些太小、太烦、太耗时的问题现在可以解决了

硬问题依然硬。 Agentic coding 的价值通常不是”AI 写代码你接受”，而是：

探索方案
搭建脚手架
调试错误
重构代码
编写测试或大规模迁移
处理较小的修复

专家仍然提供品味、约束和最终判断。

与 Agent-Paradigm-Shift 呼应：Agent 范式转移已成为共识，但落地形态仍高度依赖人的参与。

5. AI 设计的迭代困境

图像生成能力大幅提升，但 迭代越多越崩溃：

难以让 AI 只改变一个特定的点，它往往同时改变很多东西
每次迭代似乎在整张图上叠加一层”滤镜”
可能需要开新聊天、写新描述、上传新文件才能修复
同样的问题也出现在写作中——要求改一个地方，模型重新塑造整篇文章

核心需求： 需要更好的空间控制工具——让 AI 只作用于特定区域，而非每次都重新诠释整个输出。

6. 设计 ≠ 生产代码

Saarinen 对”设计工具直接操作生产代码库”的流行叙事提出质疑：

设计工作大量是决策和探索，不是最终实现
不应让每个改动都承担生产代码的速度或 token 成本
不想因为 prompt 不完整就遇到报错
设计是视觉领域，视觉画布工具仍然最有效

更理想的方向：

语义化 UI 设计工具——画的不是矩形，而是”模态框”，能继承系统某些属性
AI 帮助填充屏幕、生成变体、探索方向——价值在模式，不在模式背后的生产代码
设计完成后，有清晰的工作流将设计文件交给 AI 转译为代码

“In the AI world, design is like planning for me.”

7. 领域决定一切

不同产品需要完全不同层次的稳定性、信任、安全和设计：

产品类型	需求特征
高频触觉工具（如邮件）	大量 UX 打磨，小摩擦会累积
后端服务	UI 可粗糙，价值在逻辑

许多 AI 公司更像后端公司：能力在模型，工具层在模型之上迭代，视觉/概念足迹很小。这更接近经典 UNIX 系统——程序独立创建、运行时组合，可组合性高于现代 macOS。

结语：观察、尝试、保持判断

“If potential were revenue, all this CapEx would already be profit.”

Saarinen 的立场是审慎的现实主义：

能力在变，但不能靠”相信”来建造
需要更真实地观察当下的可能
决定什么值得做
随现实变化而调整

衍生创作

morning-journal-ai-pricing-shift — 博客/晨记：从 Karri 的专业能力悖论出发，推演 Agent 时代用户用脚投票

参考资料

来源：Some Notes on AI（Karri Saarinen, 2026-04-26）

Notes Wiki

Explorer

Reality-of-AI-Now