个人评价体系

创建时间: 2026-04-28 来源: [[sources/翁家翌:OpenAI,GPT,强化学习,Infra,后训练,天授,tuixue,开源,CMU,清华|WhynotTV Podcast #4|4]] 相关: Weng-JiayiHedonic-AdaptationSense-of-ProgressAI-Era-Solo-Entrepreneurship


核心主张

不应该使用别人提供的评价体系,而应该创造自己的评价体系并为之奋斗。 现有的评价体系(GPA、论文数、学历层级)只是社会为了快速筛选人而收敛到的策略——方便但不个性化。

翁家翌的三阶段挣脱

第一阶段:意识到问题(本科)

  • 意识到应该创造自己的评价体系,但”挣脱了一点,还没有完全挣脱出来”
  • 做法:最低限度投入 GPA——算好已有分数,期末考多一分都不愿花时间(87 分 B+ 就很满足)

第二阶段:采用非官方标准(导师给的)

清华计算机系导师给出的三个指标:

  1. 论文 — 有就行,多一篇少一篇没意义
  2. 比赛 — 已经拿了 VisDoom 冠军
  3. GitHub 三位数 star — 想要一个”正儿八经的三位数”(天授满足了这个目标)

第三阶段:创造自己的终极标准

  • “人生结算分数 = 记得你名字的人数” — 高三时突然冒出来的想法
  • 不是 fame(名声可能有负面),而是做对大家有意义的事,让更多人发自内心认可
  • 具象化为:GitHub star、tuixue 点击量、OpenAI Blog 上的 contributor 出现次数
  • 关键差异: 这是共识,不是官方评价体系的认同——“每个人发自内心的给你点赞”

与社会评价体系的张力

短期 vs 长期的矛盾

  • GPA 在本科 3-4 年内是升学/出国的生死线,但 3 年后完全不重要
  • 处理方式:最低限度投入——达到门槛后一分都不多花

学历层级的迷思

“PhD 要好于 Master——因为大家有一种固有认知。但很多时候这是不成立的,真的取决于你到底干了什么。”

翁家翌自己的经历:对着 PhD 申请却只拿到 Master,一度感到挫败。但回头看,Master 反而让他更快进入工业界,走到了比大多数 PhD 更核心的位置。

评价体系的收敛性

“评价体系是一个很简单直接的操作,能够快速地筛选人,所以社会发展方式会收敛到这种策略上,短时间内无法改变。”

翁家翌虽是这个体系的胜出者和受益者,但仍然不喜欢它——“应该更个性化。“

核心原则

  1. 从需求方的角度看:招人最重要的是”能用、能干活”,相关经验比 GPA 重要得多
  2. 标准可以改:不被自己的标准奴役——“如果出现被自己标准推着走的情况,你可以改”
  3. 只对自己要求:不把自己的标准施加给别人——“我不觉得自己的标准可以放之四海而皆准”
  4. 够用就行:对不认同的标准只投入最低限度

与正反馈循环的关系

翁家翌的整个人生选择可以被理解为为自己的评价体系设计正反馈循环

  • 数学 → 做题快 → 成就感 → 继续学(正反馈)
  • 篮球/跆拳道 → 被虐 → 无正反馈 → 放弃
  • 开源项目 → star/点击量 → 满足感 → 继续做慈善项目
  • OpenAI infra → model release 出现名字 → reward → 继续深耕 infra

他本质上在为自己设计的 reward function 做 RL。

引用

  • “评价体系应个性化,不应只看重 GPA 等既有标准,而应创造适合自己的评价体系并为之奋斗。”
  • “哪怕你是这个评价体系的胜出者和受益者,其实你也不喜欢这个评价体系。”
  • “我只是对我自己这么要求的,我不会对别人这么要求。”
  • “如果人生是一场游戏,结算分数是记得你名字的人数。“

参考资料

  • 来源:4