罗福莉
创建时间: 2026-04-27
来源: [[sources/138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权]]
相关: Agent-Paradigm-Shift,MiMo-V2,OpenClaw,Flat-Organization
基本信息
- 身份:小米大模型团队负责人,主导研发 MiMo-V2 系列模型
- 过往履历:阿里达摩院 → DeepSeek → 小米
- 代表工作:MiMo-V2 系列(Flash、Pro、Omni、TTS),曾在 DeepSeek 参与 DeepSeek-V3 训练
- 外部标签:“AI 天才少女”(本人不喜欢此称呼)
技术判断与预判
2026 年核心判断
- AI 范式已从 Chatbot 转向 Agent,这是结构性巨变而非渐进演化
- 预训练与后训练的算力比例趋向 1:1
- 1T 以上参数规模是 Agent 时代接近 Claude Opus 4.6 水平的入场券
- AGI 级别的自迭代(AI 自己训出更强的模型)将在一两年内发生
- “接下来两三个月会非常精彩”
技术品味
- 追求 non-cognitive 效率(推理速度 + 成本)作为模型架构设计的首要目标
- 信奉简洁架构 > 极致优化——给后训练留发挥空间
- 不盲从主流:当业界追捧 MoE/MLA 时,坚持 Hybrid Attention 路线
- 否定 Benchmark 崇拜:范式转移时可以短暂放弃 Benchmark,靠体感测量
管理哲学
完全扁平化
- 100 人团队,无层级、无职级、无固定组别
- 不设预训练组/后训练组——人员随训练阶段自由流动
- 有推动项目的人,但不对参与者有绝对控制权
热爱驱动
- “靠热爱驱动管理”——激发热情,让大家围绕信仰自驱做事
- 不设 KPI、不定 DDL——“模型训好了我们再发”
- 相信”平权有利于所有人平等地贡献创造力和智慧”
- 拒绝”没了我就不行”的心态——不利于创新团队的诞生
人才观:环境 > 经验
- 偏好招募大二大三本科生而非有经验博士——后者”思想被禁锢了”
- 有经验的人带着既定思维范式,而本科生天然更接纳 Agent 新范式
- “这些能力最多一两个月,慢的话三四个月都可以被快速习得”
- 环境比经验更重要
筛选标准
通过聊天感知候选人是否靠热爱驱动——“为了热爱驱动做事情的人是非常明显的”
工作方式
强推 OpenClaw 的方式
春节期间强制团队使用 OpenClaw——“对话次数不超过 100 的人可以直接 quit”。但不是真的考核,而是传递态度:“你不用,你可能真的要落后了。“
研发节奏
- 发现 Loss Spike 会停下来花一两周彻底排查,而非将其当作常态
- 没有 DDL 压力(不是创业公司 KPI 驱动),追求把问题彻底解决
- 但会因”浪费算力资源在做无用实验”而产生自我批判
个人特质
- “每天都在否定昨天的自己,在否定和自我反省当中成长”
- 持续处于高度兴奋状态——“你感觉它停不下来”
- 从”OpenClaw 太玄幻不想接触”到”三天内认知被彻底颠覆”——愿意快速修正自己的判断
引用
- “我觉得任何层级本质上都是在规范和约束,而规范和约束在某种程度上是压制创造力的。”
- “如果一旦有’没了我就不行’这样的想法,反而不利于一个创新团队的诞生。”
- “我感觉每天都在否定昨天的自己,我是在这种否定和自我反省当中成长的。“