Codex 与 AI 编程的未来 — OpenAI 播客第六集

https://www.youtube.com/watch?v=OXOypK7_90c

你好,我是 Andrew Mayne,欢迎收听 OpenAI 播客。在本期节目中,我们将与 OpenAI 的联合创始人兼总裁 Greg Brockman,以及 Codex 工程负责人 Thibault Sottiaux 对话。我们将探讨“凭感觉编程”、GPT-5 Codex,以及展望 2030 年技术发展的可能方向。

Greg Brockman: 只要坚信,更强的智能最终会长远胜出。

Thibault Sottiaux: 它为人们在 Codex 中使用 GPT-5 的方式做了极致的优化。

Greg Brockman: 你如何确保 AI 产生的东西是真正正确的?


缘起:当语言模型第一次写下代码

Andrew Mayne: 我从第一版 Codex 开始就一直在用它,最近整个周末都在体验新版本,它的进步让我印象非常深刻。这项技术在短短几年里取得了如此惊人的发展,真是不可思议。我很想知道它最初的故事,用语言模型来写代码这个想法,究竟是怎么来的?

Greg Brockman: 我还记得在 GPT-3 时代,我们第一次看到它生命初现的迹象:给出一个 Python 函数的文档字符串(docstring),然后看着模型补全了函数的代码。

那一刻,你就知道,这事儿能成,而且会搞得很大。

我还记得,我们当时定下了一个雄心勃勃的目标:想象一下,如果一个语言模型能写出一千行逻辑连贯的代码,那该多厉害。这对我们来说,曾是一个宏伟的目标。但疯狂的是,这个目标早已实现,甚至被远远甩在身后了。我们现在对此已经习以为常。

开发这些技术时,你往往只会盯着那些漏洞、缺陷和不完美的地方。但偶尔停下来回望,你会意识到,我们真的已经走了很远。

Thibault Sottiaux: 是啊,我们对事物持续不断的进步已经习以为常,这太不可思议了。它已经成了我们每天的得力助手,你每天都在用它。可回想一个月前,很多事情都还无法实现。这种飞速的进步一直在发生。我觉得人类适应新事物的速度之快,本身就是一件很迷人的事。

专攻代码:一个“例外”的决定

Greg Brockman: 我们一直面临一个抉择:是否要在一个领域深耕。毕竟,我们的最终目标是 G——也就是通用人工智能 (AGI, Artificial General Intelligence)。所以,我们的本能是全面提升所有能力。

编程一直是个例外。我们投入了完全不同的资源,专门关注编程数据、代码指标,并努力去真正理解我们的模型在代码上的表现。虽然我们后来也开始在其他领域这样做,但编程始终是我们一个非常特殊的焦点。

在 GPT-4 的时候,我们打造了一个在所有方面都实现飞跃的单一模型。但其实在那之前,我们就已经训练过专门的 Codex 模型。我记得大概在 2021 年,我们就在努力打造一个专注于 Python 的模型,想把它的编程能力推向极致。

我记得,当我们做 Codex 的演示时,那或许是第一次展示我们今天称之为“凭感觉编程 (Vibe Coding)”的场景。

“配套工具”:从大脑到身体的进化

Greg Brockman: 我当时在构建那个演示界面时,突然意识到一个问题。对于标准的语言模型任务,交互界面非常简单,无非就是补全一段文本,或许再加一轮对话。

但对编程来说,文本是活的。你需要执行它,需要将它连接到各种工具上。你很快就会发现,“配套工具 (harness)”——也就是围绕模型的整个支持系统——对于模型的可用性,几乎和智能本身同等重要。

Andrew Mayne: 你能用简单的语言解释一下“配套工具”是什么吗?

Thibault Sottiaux: 其实很简单。模型本身只会输入和输出。我们所说的“配套工具”,就是如何将它与其它基础设施整合,让模型能对环境采取行动。它包括一套工具集,以及模型行动的循环方式,我们称之为“智能体循环 (agent loop)”。把它想象成,模型是你的大脑,而配套工具就是你的身体

当你把这些部分整合起来,并进行端到端的训练时,你就会看到非常神奇的行为。模型真正获得了行动和创造的能力,成为你真正的合作者。

Andrew Mayne: 确实,看到它从 GPT-3 时代进化到现在,感觉很奇妙。那时你得先写好注释,比如用 # 告诉它“这个 Python 函数是做什么的”,它才能写代码。现在模型已经能凭直觉自然地理解编程了。

速度与智能的权衡

Greg Brockman: 2022 年,我们和 GitHub 合作推出了 GitHub Copilot。那次合作最有趣的地方在于,你第一次真切地感受到,在编程工作流的中间有一个 AI 是什么样的体验,它能如何为你加速。

当时有很多关于最佳交互界面的讨论:你是想要它像“幽灵文本”一样直接补全,还是想要一个下拉菜单提供多种选择?但有一点非常明确:延迟是产品的一个关键特性

对于自动补全这样的功能,你只有大概 1500 毫秒的时间来生成结果。任何比这更慢的,就算它再聪明,也没人愿意干等着。所以,来自用户和产品经理的明确指令是:在满足延迟限制的前提下,给我最聪明的模型。

这时候,像 GPT-4 这样更聪明但速度更慢的模型出现了。它无法满足延迟预算,那它就没用了吗?当然不是。你需要做的,是改变配套工具和交互界面。我认为这是一个非常重要的主题:你必须让交互界面和使用模型的方式,围绕着模型的能力共同进化

速度超快又聪明的模型当然很棒,但那些极其聪明但速度稍慢的模型也同样有价值。我们的信条一直是,从长远来看,对更高智能的投资是值得的。尽管在当下,人们可能会觉得“这太慢了,谁会用啊?”,但我们的方法一直是:坚信更强的智能最终会长远胜出

从“复制粘贴”到真正的智能体

Thibault Sottiaux: 我们最早观察到的一个信号是,公司内外的很多开发者都在用 ChatGPT 帮他们调试非常复杂的问题。我们清楚地看到,人们正想方设法把越来越多的上下文(代码片段、错误堆栈)喂给 ChatGPT。

这些交互变得越来越复杂,直到某个时刻我们意识到:嘿,与其让用户来主导这件事,**为什么不让模型自己来主导交互,自己去寻找上下文,自己解决这个难题呢?**这样,你就可以坐下来,看着模型完成工作了。

正是这种交互模式的反转,促使我们更多地思考“配套工具”,赋予模型行动的能力。

Greg Brockman: 我们迭代了不同的产品形态。今年年初,我们有几种不同的方案。有异步的、智能体式的配套工具,也有本地的体验。我们内部甚至有一个叫 10X 的工具,完全在终端里运行,因为它给我们带来了十倍的生产力提升。我们当时觉得这还不够完善,所以没有作为产品发布。

Thibault Sottiaux: 现在,我们又回过头来,把这种智能体的能力带回你的终端和集成开发环境 (IDE)。我们真正想做对的,是创造一个与你并肩工作的实体,一个合作者,并把它带到你已经习惯使用的开发工具中。

未来的雏形:与 AI 协作的N种方式

Greg Brockman: 我认为我们已经看到了未来的轮廓。很明显,你未来会想要一个拥有自己电脑的 AI,它能运行,能把任务委派给一个智能体舰队,并行解决多个问题。

你早上醒来,一边喝咖啡,一边回答你的智能体提出的问题,给它一些反馈,比如“哦,这个不太对,不是我想要的”。这样的工作流是必然会发生的。

Thibault Sottiaux: 但现实是,很多人的开发环境配置非常复杂,可能只在他们自己的笔记本电脑上才能运行。我们希望能够利用这一点,走到开发者身边,让他们不需要为 Codex 做任何特殊配置,就能轻松体验到一个强大的编程智能体的威力。

Andrew Mayne: 现在我面临的问题是,当我坐下来工作时,我该用命令行工具 (CLI),还是用 VS Code 插件?

Thibault Sottiaux: 我们现在仍在试验阶段。我们发现,高手用户更喜欢在终端里处理复杂的自动化工作流,而在处理具体文件或项目时,则更偏爱在 IDE 里操作,因为界面更友好,可以撤销,可以清晰地看到修改。

Greg Brockman: 我认为未来的方向是将这些工具更紧密地整合起来。最终,我们的愿景是,应该有一个 AI,它既能访问自己的云端计算机集群,也能像坐在你旁边一样,随时在本地帮助你。这些不应该是割裂的东西。

Thibault Sottiaux: 对,它就像一个统一的编程实体,随时准备帮助你、与你协作。就像我和 Greg 合作,我不会抱怨他有时在 Slack 上,有时我们当面聊,有时通过 GitHub 的代码审查交流。这在与人类合作时显得非常自然,这也是我们对 Codex 的设想。

agents.md:给AI写一份说明书

Andrew Mayne: 你们能解释一下 agents.md 是什么吗?

Thibault Sottiaux: agents.md 是一个你可以提供给 Codex 的指令集文件,它和你的代码放在一起。这样 Codex 就能获得更多关于如何更好地理解代码和完成任务的上下文。我们发现,在里面放两样东西特别有用:一是代码库的导航指南,帮助智能体更高效地探索,而不是遍历所有文件;二是个人偏好,比如“测试文件应该放在这里”,或者“我喜欢用这种方式做事”。

Greg Brockman: 这背后有一个很根本的问题:你如何向一个毫无背景的智能体传达你的意图和偏好?我们为人类写 readme.md,而 agents.md 就是为智能体准备的。当然,现在的智能体记性不太好,这是我们需要通过研究解决的问题,让智能体能够通过探索和记忆,真正深入理解你的代码库。

GPT-5 Codex 登场:更强韧、更敏捷

Andrew Mayne: 我们现在迎来了 GPT-5 的发布,随之而来的是 GPT-5 Codex。先生们,我为什么应该对此感到兴奋?

Thibault Sottiaux: GPT-5 Codex 是我们为 Codex 配套工具特别优化过的 GPT-5 版本。我们把它看作一个整体,模型和工具集紧密耦合。

它变得更可靠了。这个模型展现出一种能长时间持续工作的能力,在处理复杂重构任务时拥有你所需要的那种毅力。我们见过它在内部为了完成一次复杂的代码重构,连续工作了长达 7 个小时。我们从未在其他模型上见过这种情况。

与此同时,对于简单的任务,它的反应速度快得多,几乎无需过多思考就能给出答复。它的代码质量也得到了极大的提升。

Greg Brockman: 我觉得最了不起的是这些模型的核心智能,简直令人惊叹。我觉得,即使是三到六个月前,我们的模型在浏览我们内部代码库方面就已经比我强了。但这并不会让我觉得自己要被淘汰了。我不会因为“擅长在代码库里找东西”来定义我作为工程师的价值。

现在,这个强大的智能可以帮我处理掉所有那些单调乏味的部分。我可以选择如何分配我的时间,我可以思考如何分解任务,指挥这些智能体去完成。我把它看作是为程序员扩展了机会的边界

展望2030:人机协同的新纪元

Andrew Mayne: 你们认为这一切会走向何方?智能体的未来会是怎样?

Thibault Sottiaux: 我们坚信,未来的方向是庞大的智能体集群在云端运行,而我们人类、团队和组织则负责监督和引导它们,以创造巨大的经济价值。几年后,数以百万计的智能体将在数据中心为我们工作。

现在的关键问题是,如何逐步达到那里?以及如何确保这一切的安全、可控和对齐 (alignment)。这就是为什么 Codex CLI 默认在沙盒环境中运行,以防它随意修改你电脑上的文件。

Greg Brockman: 我认为 Thibault 说得完全正确。在技术层面,我们需要解决很多问题,比如“可扩展的监督 (scalable oversight)”。当你有大量智能体在写代码时,你如何信任它们,而不需要阅读每一行代码?

但还有更宏大的图景。我们至今还未真正看到 AI 解决那些极其困难的、全新的问题。现在我们用它来重构代码,但未来呢?想象一下,在医药领域研发新药,在材料科学领域创造具有新特性的材料。

对我来说,一个重要的里程碑将是:AI 第一次创造出一件本身就极具价值和趣味性的东西。不是因为它由 AI 创造,也不是因为它成本更低,而仅仅因为它本身就是一个突破。我们已经开始在生命科学领域看到这种迹象,GPT-5 的表现已经达到了博士生研究员的水平,这太疯狂了。

Andrew Mayne: 那么 2030 年会是什么样子?

Greg Brockman: 我想,我们将进入一个物质极大丰富的世界。AI 将使创造任何你想要的东西变得超乎想象地容易。但这很可能也会是一个计算资源绝对稀缺的世界。

我们已经在 OpenAI 内部感受到了这一点。研究项目的成功很大程度上取决于计算资源的分配。未来,你创造力的瓶颈,部分在于你的想象力,另一部分就在于背后的算力。如果每个人都想拥有一个专属的智能体持续为自己工作,那我们可能需要将近 100 亿个 GPU。我们离这个数量级还差得很远。

终极问题:我们还应该学编程吗?

Thibault Sottiaux: 我认为现在是学习编程的绝佳时机。

Greg Brockman: 我同意。一定要学编程,但更要学会使用 AI

Thibault Sottiaux: 用 Codex 学习一门新的编程语言,比如 Rust,是一种非常愉快的体验。我们团队很多人都是 Rust 新手,但借助 Codex,他们能快速上手,提出问题,探索陌生的代码库,并取得出色的成果。

Greg Brockman: 我回想起自己学编程的方式,是通过看各种在线教程。我曾经为了序列化数据,自己发明了一套笨拙的方法,用一串特殊字符做分隔符,完全没考虑过数据本身就包含这串字符怎么办。

如果是今天,Codex 的代码审查功能会直接告诉我:“嘿,有现成的 JSON 序列化库,用这个就行了。”它能回答那些你甚至不知道该去问的问题。这就是为什么我认为,现在是前所未有地适合创造和构建的时代。

最后的思考

Thibault Sottiaux: 自从发布以来,Codex 的使用量增长了超过 10 倍。我们看到越来越多的用户开始进行更复杂的尝试,使用时间也更长了。

Greg Brockman: 我认为,当人们真正理解了该如何使用 GPT-5 和它的配套工具后,一切就开始“咔哒”一下豁然开朗,然后他们就能以惊人的速度前进。我们很高兴看到这一切的发生,指数级的进步仍在继续。将这些工具带给每一个人,让它们变得可用、有用,是我们使命的核心。

Thibault Sottiaux: 谢谢邀请。现在,我感觉自己每天跟 Codex 交流的时间比跟大多数人还多。它是我真切感受到 AGI 的方式,我希望更多人能从中受益。