高中辍学生靠 ChatGPT 自学成才成了 OpenAI 的研究科学家

Gabriel Petersson 是 OpenAI Sora 团队的研究科学家，负责视频生成模型的研发。在这个通常要求博士学位的岗位上，他没有高中文凭，没有大学学历，靠 ChatGPT 自学了数学和机器学习。

High School Dropout to OpenAI Researcher - Gabriel Petersson Interview (Extraordinary)

他出生在瑞典中部一个叫 Vaggeryd 的小镇，17 岁辍学加入创业公司，19 岁当过瑞典最大云厨房的临时 CTO，此后在 Dataland、Midjourney 做工程师，2024 年 12 月加入 OpenAI。他拿的是 O-1 杰出人才签证，申请材料之一是 Stack Overflow 上的技术回答帖。

在 Extraordinary 播客中，他和主持人 Sigil Wen 聊了这段经历的全过程：怎么辍学、怎么自学、怎么用 AI 做研究、怎么找工作、怎么看待教育。以下是这场对话的整理。

要点速览

自上而下学习法：传统学扩散模型要从微积分和线性代数学起，至少六年才能接触实际模型。Gabriel 用 ChatGPT 自上而下递归学习，三天就建立了扩散模型的核心理解。
Sora 团队日常：盯着生成的视频找问题，改模型架构或数据，训练，看结果，循环。过程中大量使用 AI 辅助，但强调“我不是凭感觉编程，对代码非常有主见”。
Demo 求职法：做一个让人 3 秒内理解你能力的 demo，直接找决策者，绕过招聘流程。“公司只想赚钱，你证明你能帮他们赚钱、你会写代码，他们就会雇你”。学历、实习、课外活动都不如一个能跑的 demo 管用。
教育体制批评：大学不再垄断基础知识，教授维护旧体系是因为自身地位受到威胁。但也承认大学“很有趣”，对不那么激进的人来说仍是合理选择。

【1】“我今晚有个大派对，明天来。”“不行。”

Gabriel 的辍学故事没有什么深思熟虑的过程。

表亲有天打电话过来，说认识了一个人，“特别聪明”，想做电商产品推荐系统的创业项目，人目前在新加坡做研究，“我们今天就开始干，你赶紧来斯德哥尔摩。”

Gabriel 当时 17 岁，住在瑞典乡下。他的回答是：“老哥，我今晚有个大派对，明天来行不行？”表亲说不行。于是他坐了下一班巴士去斯德哥尔摩，再也没回过高中。

这家公司就是后来进入 Y Combinator（S20 批次）的 Depict.ai，做的是用 AI 给电商网站生成产品推荐。团队全是十七八岁的年轻人，研究者 Oliver Edholm 当时 16 岁。【注：Depict.ai 后来获得 Tiger Global 领投的 1700 万美元 A 轮融资，客户包括 Office Depot 和 Staples。】

没人懂创业，也没人懂销售。Gabriel 一开始发冷邮件，效果不好。后来改打电话，好一些但也有限，毕竟他是个 18 岁的非技术人员。

他想出了一个办法：提前爬取目标公司的网站，训练出新的产品推荐系统，然后把结果打印在 A3 大纸上，左边是客户现有的推荐，右边是他们的推荐。他做了上百张，装进一个大文件夹，直接敲人家公司的门。

“嘿，能跟你们的电商负责人聊聊吗？”然后掏出对比图。客户总是很惊讶，“你做了所有这些？怎么做的？太酷了。”

但客户紧接着会问：从这里到上线要多久？有什么未知风险？Gabriel 早有准备。他带了一段脚本，可以直接粘贴到客户网站的浏览器控制台里，当场切换产品推荐系统，而且内置了 A/B 测试，自动追踪两套推荐各带来多少收入。第一次见面就能签单。

那段时间他住在表亲的“宿舍”里。瑞典没有真正的大学宿舍，是一种只有在校学生才能申请的小公寓。他不是学生，所以每次需要提交材料时都得想办法。他睡的床是从公共休息室捡来的沙发靠垫。

“那个房间很恶心，但能用。”

Sigil 问他为什么能坚持。大部分人可能会放弃回去上学。

Gabriel 说：

“我一直对现实有种扭曲的感知。我 100% 确信这会让我成为亿万富翁。100%。世界上没有一丝怀疑。”

他通宵接着通宵地工作，在斯德哥尔摩四处跑着做销售。在他看来，其他一切都不重要。

【2】“我一直觉得自己太笨了”

Gabriel 辍学的时候不会写代码。

他的编程启蒙来自表亲。13 岁时表亲给他看了 Java，他做了一个极其简陋的宝可梦回合制小游戏。后来在 Udemy 上学了点 Python，做了一个躲子弹的鸭子游戏。他也试过 Andrew Ng 的机器学习课程。【注：Andrew Ng 是斯坦福大学教授，他在 Coursera 上的机器学习课程是全球最受欢迎的 AI 入门课程之一。】

他对这段经历的总结是：

“我一直觉得自己太笨了。就是做不了这些东西。”

真正学会编程是在 Depict.ai。因为公司要活下去，他被迫去解决真实问题：构建推荐系统、写网页爬虫、做客户集成、搭建 A/B 测试。

他认为有真实问题反而让学习简单得多。“大家总说，不上学怎么学东西？其实反过来更容易。你有一个真实问题，可以拆解成步骤：我要把推荐系统集成到这个电商网站，那我需要学怎么选择网页元素、怎么插入内容……然后一步步来，去 Stack Overflow 查，问朋友。”

关键是压力。“如果有人跟我说，学这个东西吧，时间无限，也不会因此赚到钱，我永远学不会。绝对不可能。”

【3】自上而下学习法——三天 vs 六年

Gabriel 认为人们学东西最快的方式是**"自上而下"**：从一个实际问题开始，读需要解决这个问题的所有东西，发现更多子问题，再读那些东西，一路递归到问题的核心。

但学校教的全是反过来的。想学机器学习？先别想碰机器学习，前四年先学数学：微积分、线性代数、矩阵分类……然后是简单的统计学习方法，如线性回归。要到很久以后才能接触生产级的机器学习。

为什么学校用自下而上？因为这种方式好规模化。第一步永远学这个，第二步永远学那个，不需要一对一辅导。但效率极低。

“现在有了 ChatGPT，这一切都变了。大学不再垄断基础知识了。你可以从 ChatGPT 那里获得任何基础知识。”

他接着说了一句引起广泛讨论的话：“我简直无法认真看待那些不把大语言模型纳入课程的大学。”

Sigil 追问：你到底是怎么用 AI 自学数学和机器学习，学到可以在 OpenAI 工作的程度的？

Gabriel 举了自己学扩散模型（Diffusion Model）的过程。【注：扩散模型是当前主流的图像和视频生成技术，通过向数据逐步添加噪声再学习去噪的过程来生成内容，Stable Diffusion 和 Sora 都基于这类架构。】

第一步，问 ChatGPT：视频和图像 AI 模型最基础的概念有哪些？ChatGPT 开始讲自编码器、扩散模型。“听起来很有意思，到处都在说这些。”

第二步，让它写一个扩散模型的完整代码。代码出来了，完全看不懂。然后和 AI 一起调试，让它跑起来。在这个过程中逐渐建立直觉。

第三步，开始逐行追问。比如代码中有个 ResNet 模块，它做了一堆变换，还有一个残差连接（Residual Connection），让数据以特定方式通过，使模型更容易学习。一开始 Gabriel 完全不懂这是怎么回事。

他继续追问。ChatGPT 解释说梯度可以通过这些路径流动，如果没有残差连接，梯度会在某些地方被阻断。他继续追问，直到真正理解。

然后他告诉 AI：这是我对这个概念的理解，完全正确吗？

他还分享了一些提示词技巧。比如“像给 12 岁小孩解释”，AI 会用生活场景做类比，“想象你在一个书店，嵌入向量就是不同的书……”，把 AI 概念和现实世界连接起来。

Gabriel 把这个过程总结为**"递归知识空白填补"（recursive gap filling）。核心技能有两个：一是感知自己不懂什么**，“等等，我真的理解这部分了吗？”这其实挺难的，需要刻意练习。二是感知什么时候真正懂了，那个“啊，click 了”的瞬间。

"追逐这些 click，让它们尽可能频繁地出现，这就是你的目标函数。"

递归知识空白填补：从实际问题出发，逐层追问直到 Click

他对比了一下：

"学扩散模型，自上而下三天。自下而上学？要六年才能接触到。"

自上而下 vs 自下而上：两种学习路径对比，3 天 vs 6 年

六年里你要学微积分 1、微积分 2、线性代数，然后机器学习入门……而且六年前你怎么知道自己想学扩散模型？这才是大学的问题所在。你要用三年才能发现自己选的方向是不是真的喜欢。

Gabriel 也强调了边界。他说学术界的人“做了令人难以置信的工作，做了对世界非常重要的研究，我绝对不是在看不起这些人。我唯一看不起的是那些伴随着旧思维方式的概念。”

【4】在 Sora 团队的日常

Sigil 问他在 OpenAI 怎么用 ChatGPT 来构建世界顶级的视频模型。

Gabriel 说很多人问他这个问题，总想象他的工作多么特别。其实相当直接。

“你看视频，发现这部分不太好。然后你去改模型架构，或者改数据。训练模型，看结果，盯着视频看一会儿。'这些视频更好了，太好了，这个进主分支。'然后循环。下一个要修的是什么？下一个要试的是什么？”

【注：Sora 是 OpenAI 的视频生成模型，2024 年底发布了 Sora 2，Gabriel 被列为该版本的研究贡献者。】

AI 在这个过程中的角色是：把整个代码库扔给 AI，让它给出 10 个改进建议，推荐相关论文，帮助和同事讨论方案。

他的论文阅读方法也很有特点。不会逐字阅读，而是让 AI 告诉他：这篇论文和已有方法相比，到底做了哪些不同的事？列一个清单，越具体越好。大部分论文看完总结就可以放弃了，只有决定实现的才深入读。而且“深入读”可能也只是在遇到 bug 的时候。

他一般的做法是把论文的方法直接让 AI 实现到自己的代码中，拷贝进去。

“但我会仔细读代码。我不是凭感觉编程（vibe coding），我对代码非常有主见。”

Sigil 追问这种区分。Gabriel 说他要的是**"走捷径去理解所有基础"**，而不是“走捷径跳过理解”。

“人们的第一反应总是：你就是想走捷径，不想真正理解，想用 AI 糊弄。我确实想走捷径，但我走捷径是为了理解所有基础。这是非常重要的区分。”

他说自己每天问 AI 一百个问题。写完代码扔进去：这好不好？有没有 bug？怎么写更简单？“有时候它说没问题，但有时候它说'你这里有个 bug'或者'可以这样更简单'。你就一直在学。”

不过他也补充，人类的意见仍然非常有价值，尤其是涉及观点和判断的时候。“AI 训练数据来自互联网上所有的观点，有时候观点会很奇怪。和最优秀的人一起工作仍然很重要。但 AI 现在能给你 95% 了。”

【5】从斯德哥尔摩到旧金山——合同工策略和 Stack Overflow 签证

离开 Depict.ai 之后，Gabriel 始终清楚自己要继续做创业公司，目标是旧金山。

他的策略是只做合同工，保持流动性。“早期职业生涯中人们犯的最大错误是在同一家公司待太久。”

每加入一家公司，他做的第一件事是“面试面试你的人”。你们做 PR（代码审查）吗？你们会认真审查我的代码让我知道犯了什么错吗？他刻意寻找代码要求极高的团队。

在 Dataland 工作时，他遇到了一位工程师，热爱教学，追求完美代码。这个人每个 PR 写上百条评论。

Gabriel 会打电话过去说：那个 review 太好了，我们一起过一遍所有评论。他追问每条建议背后的第一性原理。

他说成为一个好工程师非常难，需要理解大量的第一性原理和直觉。“它们一旦知道了就很简单，但学起来可能很难。有人直接告诉你，而你又善于吸收，这是一种巨大的优势。”

而现在，AI 可以在任何时间、任何公司提供这种反馈。“可以是凌晨 4 点，你一直在写代码，你仍然可以问 AI 为什么这个决定更好。”

来美国的路不太顺利。他一开始在 Dataland 启动了 J-1 签证（类似实习签证），因为所有人都觉得 O-1 签证不可能。【注：O-1 签证是美国颁发给在科学、艺术、教育、商业或体育领域具有杰出能力的外国人的非移民签证，有时被称为“爱因斯坦签证”。】

后来公司变动，他决定离开。先以 ESTA 旅游签在旧金山住了几个月，跟各种人交流。之后加入了 Midjourney。【注：Gabriel 在 Midjourney 期间开发了高性能的 Web 图片网格、内部超参数调优工具和数据集探索器。】

在 Midjourney 期间，他开始认为 O-1 也许可行了。而且发现申请 O-1 有很多“创意路径”。

比如他用 Stack Overflow 上的技术回答来满足“学术发表”的标准。他的帖子有数百万浏览量，有严格的同行评审机制（投票系统会删除不正确的内容），帮助了大量开发者。

他的表亲曾经说他"浪费时间回答 Stack Overflow 上的问题"。Gabriel 当时说："你不知道说不定以后用得上。"结果真的用上了。

Gabriel Petersson 职业时间线：从 17 岁辍学到 OpenAI Sora 研究科学家

【6】没有学历怎么找工作——Demo 方法论

Sigil 问：如果你是个无名小卒，从天涯海角来，怎么向重要的人展示自己的价值？

Gabriel 给出的回答是：做一个 demo。

但他马上补充，好 demo 的难点不在技术。“很多人以为 demo 难做是因为技术难、自己能力不够。不是的。你不需要多少编程知识就能做出很酷的 demo。”

难的是两件事：让人 3 秒内理解你在看什么，以及让人 3 秒内理解你是个好工程师。“你有一次机会，100 个申请者里别人点开你的链接，3 秒钟。”

然后他把求职建议简化到了一个句子：

“公司只想赚钱。你证明你能帮他们赚钱、你会写代码，他们就会雇你。”

那些传统的求职建议呢？学历、实习、课外活动、辩论冠军？

“面试官问你做过什么，你说'我优化了流程提升了 30% 效率'。好吧，我还是不知道你能不能做这个工作。你去了哈佛成绩很好？我还是不知道。你是辩论冠军？我还是不知道。”

他说这些东西之所以受重视，仅仅是因为没人能直接证明自己能做事。既然看不到真本事，那就只好看学历、看履历、看奖项，拿这些间接标准来猜一个人行不行。

Demo 求职法：用作品说话，而不是用简历说话

接着他做了一个很有趣的分析：谁最依赖这些间接标准？

CEO 永远不在乎。他们只想赚钱。你说“我能帮你赚钱”，他说“好的，这是一个任务”。离 CEO 越远的人越在乎，因为他们的激励变了，不是做最好的决定，而是不犯错。

“招聘经理怎么确保不犯错？雇名校毕业的人。如果那个人表现不好，'你能怪我吗？人家上的是顶级学校啊。'”

他的建议是：绕过没有激励的人。别找招聘经理，他们甚至不是技术人员，无法判断你好不好。直接去科技活动，找创业者聊天，给他们看你做的东西，然后提议：“我们免费合作一周试试？”

“100% 的人会说好。他们什么都不用投入，就能看看你行不行。”

“有了第一份真正的工作之后，没有人会再看你的学历。你有了实际做出来的东西，学历还有什么用？”

不过他补充，这些建议是给真正想全力投入职业的人。他也会告诉朋友去上大学，那里很有趣，能交到朋友，甚至能学到东西，只是教法不够高效。“你还是能得到那些东西，只是效率低一些。”

【7】教授们为什么这么生气

Sigil 拿出 Gabriel 在 X 上的几条帖子让他展开。

其中一条：“大学不再垄断基础知识了。下面是我作为一个高中辍学生怎么用 ChatGPT 学会扩散模型核心直觉的。”

另一条更尖锐：“我目前在做一份传统上只有博士才能做的工作，零机器学习和数学经验，全靠 ChatGPT。不知道还需要什么证据来证明 ChatGPT 达到了博士水平。”

Gabriel 解释了为什么学术界对此反应这么强烈。"如果你是一个教授，一辈子都在跟人说为什么上大学很重要，突然有人说不需要了。最聪明的人如果开始自学，就不会去大学了，教授的地位就降低了。自我受到了威胁。"

“人们花了 10 年做一件事，然后一个高中辍学生冒出来学了几天就拿到了那个职位。这很难受。当我写这类东西的时候，会伤害到一些人的感情。说实话，这某种程度上就是目的，因为这些人在阻止其他人进入他们想进入的领域。”

Sigil 用了一个比喻：大学在很多方面像“成人日托”。Gabriel 补充说，尤其在瑞典，大学免费，还能拿到补贴。“有人跟你说'这里有免费的钱，你可以继续推迟做决定'。还有一堆专业什么都不用决定，你再无目的地学五年。”

“人们喜欢推迟决定。因为做一个选择感觉像是永久地决定了你这辈子要做什么。其实不是，但感觉是。”

他也举了一个例子：有人花五年学法律然后转行做市场营销，薪水更高、更开心。周围的人却会说“你不是浪费了五年吗？”“这个问题对我来说很奇怪。这个人升级了生活满意度和薪水，为什么是浪费？”

【8】70% 的人在永久性轻度痛苦中

Sigil 问：对那些不知道自己想做什么的人有什么建议？

Gabriel 说他见过太多这样的人，自己也经历过。从小学后期开始，“我想赚钱，想成功，但不确定那意味着什么，因为我什么都没见过，甚至不知道什么是创业公司。”

然后你上网搜“怎么赚钱”，做问卷调查赚几毛钱，觉得“天哪我在网上赚钱了”。没有人告诉你该从哪里开始。大人只会说“去上大学，等 8 年再说”。

他的建议是：尽快做真实的工作。世界上有几百万家创业公司愿意接受免费劳动力。去 LinkedIn 找隐形模式的创始人，给所有人发消息：“我想和你试着合作一周末，零承诺，我准备做任何事。”

“我这辈子做的所有不指向获得真实经验的事情，比如在初高中时期读书、培养好习惯、早起跑步、觉得自己特别高效，全部毫无意义。如果你不是同时在做一件真正重要的事，那些都是零。”

然后他展开了那条 X 上很火的帖子：

“70% 的人处于永久性轻度痛苦中，因为他们对任何艰难的决定都过敏，只要有'什么都不做'的选项就选择什么都不做。”

他举了一个具体例子。他在瑞典有个朋友，薪水比平均水平高 50%，日子过得不错。Gabriel 劝了他一年去申请旧金山的工作。“你的薪水能翻 10 倍，跟更好的人一起工作，做真正有人用的产品。”

朋友总能想出各种理由不去做。大脑会自动阻止你思考这件事，因为申请工作太痛苦了：准备面试、可能被拒、谈 offer、跟现在的老板说要走。

最后 Gabriel 直接把他介绍给了一家公司。“面试一旦开始就简单多了，因为公司会拉着你往前走。”朋友拿到了 offer，薪水翻了 10 倍。

“他因为拖延这件极其简单的事情，损失了在瑞典买一套房子的钱。”

关于听取建议，Gabriel 也有一套判断框架。他几乎不听别人的建议，能数得过来的只有几个人，其中最重要的是他的表亲。

“观点几乎总是跟着激励走。一个花了五年上大学、对自己的职业从没认真思考过的人，你问他该怎么办，他当然会告诉你花五年上大学。他出发点是好的，但他的建议完全没有意义。他只走过一条路，从来没比较过，而且心理上也不允许自己承认可能走了弯路。”

关于父母，Gabriel 的经历比较特殊。他的父母在“自我投射到孩子身上”的光谱上处于最低端。他们对成绩的唯一要求是 A 到 F 的评分里拿个 E 就行。Gabriel 年轻时因此生气，觉得父母不推他。后来他意识到，这种“低期望”给了他完全的实验自由。

他观察到另一种极端：父母把自己没实现的梦想投射到孩子身上。“你要当医生、当律师，这是我的梦想，也应该是你的梦想。”这些父母真心觉得是为孩子好，但往往是自我驱动的。“我想让我的孩子做这些，这样我就能跟邻居炫耀。”

【9】为什么要来旧金山

Gabriel 把旧金山的吸引力归结为人才密度和资本流动。“你第一周来这里，世界观就会改变。'天哪，我不知道世界上有这么多人在乎我做的事情，而且他们现在全在同一个房间里。'”

他把这种体验和看激励视频做了对比。“这才是真正的激励。不是有人站在台上说一堆听起来不错的话。这是真实的，有人跟你想的一样、做的一样、工作一样努力、一样在乎。他们不是朝九晚五。”

他做了一个大胆的估算：“仅旧金山的产出可能超过整个欧洲。仅旧金山的资本可能比整个欧洲加起来还多。Apple、Google、OpenAI、Anthropic，总部都在这里。”

给想来的人的建议：先变得厉害。“是你需要展示巨大的价值，因为公司要帮你处理签证流程，这对他们是额外的麻烦。他们当然更愿意直接雇本地人。但全球真正优秀的软件工程师非常稀缺，我们把美国优秀工程师的数量翻一倍也不够。”

在整场对话接近尾声时，Gabriel 分享了一个回顾性的认识。他说在瑞典小镇长大时，一个很大的障碍是觉得自己不够聪明。“你看到有人在造火箭，有人在做了不起的事情，你觉得自己怎么可能做到。但人们太容易低估自己能做的事了。”

他说，可能光是在听这期节目的人就已经是前 1% 了。“大多数人不会有这个主动性去花一个小时听一期播客来改善自己。你已经是前 1% 了，而前 1% 就意味着世界前 200 名创业公司里的人。只要继续走下去就行。”

Sigil 最后的评价是：“你可能是世界上最擅长用 AI 学习的人之一。”Gabriel 笑着说：“我希望更多人能比我做得更好，这样我就能向他们学习了。”

Q&A

问：Gabriel 的核心学习方法是什么？ 答：“递归知识空白填补”。从实际问题出发，用 AI 逐层追问，每遇到不懂的就继续深挖，直到真正理解。核心技能是识别自己的知识盲区，以及感知何时真正“click”了。

问：没有学历怎么找到好工作？ 答：做一个让人 3 秒内理解你能力的 demo，直接找创业者或决策者展示，提议免费试工一周。绕过招聘经理，因为他们的激励是不犯错，而不是找到最好的人。

问：他怎么拿到美国签证的？ 答：先在 Midjourney 积累了足够的行业影响力，然后申请 O-1 杰出人才签证。用 Stack Overflow 上的高质量技术回答代替传统的“学术发表”标准。

问：他在 OpenAI 具体做什么？ 答：Sora 团队研究科学家，日常工作是观察视频生成结果、修改模型架构或训练数据、训练模型、评估效果，循环往复。大量使用 AI 辅助但坚持理解每行代码。

问：他认为大学完全没用吗？ 答：不是。他认为大学是有趣的体验，能交朋友、学到东西。但教学方式效率低，而且大学不再是获取基础知识的唯一途径。对于有强烈职业野心的人，他建议尽快进入真实工作场景。

原始视频来源：Extraordinary 播客，Gabriel Petersson 专访 https://www.youtube.com/watch?v=vq5WhoPCWQ8