罗福莉

创建时间: 2026-04-27 来源: [[sources/138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权]] 相关: Agent-Paradigm-ShiftMiMo-V2OpenClawFlat-Organization


基本信息

  • 身份:小米大模型团队负责人,主导研发 MiMo-V2 系列模型
  • 过往履历:阿里达摩院 → DeepSeek → 小米
  • 代表工作:MiMo-V2 系列(Flash、Pro、Omni、TTS),曾在 DeepSeek 参与 DeepSeek-V3 训练
  • 外部标签:“AI 天才少女”(本人不喜欢此称呼)

技术判断与预判

2026 年核心判断

  • AI 范式已从 Chatbot 转向 Agent,这是结构性巨变而非渐进演化
  • 预训练与后训练的算力比例趋向 1:1
  • 1T 以上参数规模是 Agent 时代接近 Claude Opus 4.6 水平的入场券
  • AGI 级别的自迭代(AI 自己训出更强的模型)将在一两年内发生
  • “接下来两三个月会非常精彩”

技术品味

  • 追求 non-cognitive 效率(推理速度 + 成本)作为模型架构设计的首要目标
  • 信奉简洁架构 > 极致优化——给后训练留发挥空间
  • 不盲从主流:当业界追捧 MoE/MLA 时,坚持 Hybrid Attention 路线
  • 否定 Benchmark 崇拜:范式转移时可以短暂放弃 Benchmark,靠体感测量

管理哲学

完全扁平化

  • 100 人团队,无层级、无职级、无固定组别
  • 不设预训练组/后训练组——人员随训练阶段自由流动
  • 有推动项目的人,但不对参与者有绝对控制权

热爱驱动

  • “靠热爱驱动管理”——激发热情,让大家围绕信仰自驱做事
  • 不设 KPI、不定 DDL——“模型训好了我们再发”
  • 相信”平权有利于所有人平等地贡献创造力和智慧”
  • 拒绝”没了我就不行”的心态——不利于创新团队的诞生

人才观:环境 > 经验

  • 偏好招募大二大三本科生而非有经验博士——后者”思想被禁锢了”
  • 有经验的人带着既定思维范式,而本科生天然更接纳 Agent 新范式
  • “这些能力最多一两个月,慢的话三四个月都可以被快速习得”
  • 环境比经验更重要

筛选标准

通过聊天感知候选人是否靠热爱驱动——“为了热爱驱动做事情的人是非常明显的”

工作方式

强推 OpenClaw 的方式

春节期间强制团队使用 OpenClaw——“对话次数不超过 100 的人可以直接 quit”。但不是真的考核,而是传递态度:“你不用,你可能真的要落后了。“

研发节奏

  • 发现 Loss Spike 会停下来花一两周彻底排查,而非将其当作常态
  • 没有 DDL 压力(不是创业公司 KPI 驱动),追求把问题彻底解决
  • 但会因”浪费算力资源在做无用实验”而产生自我批判

个人特质

  • “每天都在否定昨天的自己,在否定和自我反省当中成长”
  • 持续处于高度兴奋状态——“你感觉它停不下来”
  • 从”OpenClaw 太玄幻不想接触”到”三天内认知被彻底颠覆”——愿意快速修正自己的判断

引用

  • “我觉得任何层级本质上都是在规范和约束,而规范和约束在某种程度上是压制创造力的。”
  • “如果一旦有’没了我就不行’这样的想法,反而不利于一个创新团队的诞生。”
  • “我感觉每天都在否定昨天的自己,我是在这种否定和自我反省当中成长的。“

参考资料