Codex 与 AI 编程的未来 — OpenAI 播客第六集

https://www.youtube.com/watch?v=OXOypK7_90c

你好，我是 Andrew Mayne，欢迎收听 OpenAI 播客。在本期节目中，我们将与 OpenAI 的联合创始人兼总裁 Greg Brockman，以及 Codex 工程负责人 Thibault Sottiaux 对话。我们将探讨“凭感觉编程”、GPT-5 Codex，以及展望 2030 年技术发展的可能方向。

Greg Brockman: 只要坚信，更强的智能最终会长远胜出。

Thibault Sottiaux: 它为人们在 Codex 中使用 GPT-5 的方式做了极致的优化。

Greg Brockman: 你如何确保 AI 产生的东西是真正正确的？

缘起：当语言模型第一次写下代码

Andrew Mayne: 我从第一版 Codex 开始就一直在用它，最近整个周末都在体验新版本，它的进步让我印象非常深刻。这项技术在短短几年里取得了如此惊人的发展，真是不可思议。我很想知道它最初的故事，用语言模型来写代码这个想法，究竟是怎么来的？

Greg Brockman: 我还记得在 GPT-3 时代，我们第一次看到它生命初现的迹象：给出一个 Python 函数的文档字符串（docstring），然后看着模型补全了函数的代码。

那一刻，你就知道，这事儿能成，而且会搞得很大。

我还记得，我们当时定下了一个雄心勃勃的目标：想象一下，如果一个语言模型能写出一千行逻辑连贯的代码，那该多厉害。这对我们来说，曾是一个宏伟的目标。但疯狂的是，这个目标早已实现，甚至被远远甩在身后了。我们现在对此已经习以为常。

开发这些技术时，你往往只会盯着那些漏洞、缺陷和不完美的地方。但偶尔停下来回望，你会意识到，我们真的已经走了很远。

Thibault Sottiaux: 是啊，我们对事物持续不断的进步已经习以为常，这太不可思议了。它已经成了我们每天的得力助手，你每天都在用它。可回想一个月前，很多事情都还无法实现。这种飞速的进步一直在发生。我觉得人类适应新事物的速度之快，本身就是一件很迷人的事。

专攻代码：一个“例外”的决定

Greg Brockman: 我们一直面临一个抉择：是否要在一个领域深耕。毕竟，我们的最终目标是 G——也就是通用人工智能 (AGI, Artificial General Intelligence)。所以，我们的本能是全面提升所有能力。

但编程一直是个例外。我们投入了完全不同的资源，专门关注编程数据、代码指标，并努力去真正理解我们的模型在代码上的表现。虽然我们后来也开始在其他领域这样做，但编程始终是我们一个非常特殊的焦点。

在 GPT-4 的时候，我们打造了一个在所有方面都实现飞跃的单一模型。但其实在那之前，我们就已经训练过专门的 Codex 模型。我记得大概在 2021 年，我们就在努力打造一个专注于 Python 的模型，想把它的编程能力推向极致。

我记得，当我们做 Codex 的演示时，那或许是第一次展示我们今天称之为“凭感觉编程 (Vibe Coding)”的场景。

“配套工具”：从大脑到身体的进化

Greg Brockman: 我当时在构建那个演示界面时，突然意识到一个问题。对于标准的语言模型任务，交互界面非常简单，无非就是补全一段文本，或许再加一轮对话。

但对编程来说，文本是活的。你需要执行它，需要将它连接到各种工具上。你很快就会发现，“配套工具 (harness)”——也就是围绕模型的整个支持系统——对于模型的可用性，几乎和智能本身同等重要。

Andrew Mayne: 你能用简单的语言解释一下“配套工具”是什么吗？

Thibault Sottiaux: 其实很简单。模型本身只会输入和输出。我们所说的“配套工具”，就是如何将它与其它基础设施整合，让模型能对环境采取行动。它包括一套工具集，以及模型行动的循环方式，我们称之为“智能体循环 (agent loop)”。把它想象成，模型是你的大脑，而配套工具就是你的身体。

当你把这些部分整合起来，并进行端到端的训练时，你就会看到非常神奇的行为。模型真正获得了行动和创造的能力，成为你真正的合作者。

Andrew Mayne: 确实，看到它从 GPT-3 时代进化到现在，感觉很奇妙。那时你得先写好注释，比如用 # 告诉它“这个 Python 函数是做什么的”，它才能写代码。现在模型已经能凭直觉自然地理解编程了。

速度与智能的权衡

Greg Brockman: 2022 年，我们和 GitHub 合作推出了 GitHub Copilot。那次合作最有趣的地方在于，你第一次真切地感受到，在编程工作流的中间有一个 AI 是什么样的体验，它能如何为你加速。

当时有很多关于最佳交互界面的讨论：你是想要它像“幽灵文本”一样直接补全，还是想要一个下拉菜单提供多种选择？但有一点非常明确：延迟是产品的一个关键特性。

对于自动补全这样的功能，你只有大概 1500 毫秒的时间来生成结果。任何比这更慢的，就算它再聪明，也没人愿意干等着。所以，来自用户和产品经理的明确指令是：在满足延迟限制的前提下，给我最聪明的模型。

这时候，像 GPT-4 这样更聪明但速度更慢的模型出现了。它无法满足延迟预算，那它就没用了吗？当然不是。你需要做的，是改变配套工具和交互界面。我认为这是一个非常重要的主题：你必须让交互界面和使用模型的方式，围绕着模型的能力共同进化。

速度超快又聪明的模型当然很棒，但那些极其聪明但速度稍慢的模型也同样有价值。我们的信条一直是，从长远来看，对更高智能的投资是值得的。尽管在当下，人们可能会觉得“这太慢了，谁会用啊？”，但我们的方法一直是：坚信更强的智能最终会长远胜出。

从“复制粘贴”到真正的智能体

Thibault Sottiaux: 我们最早观察到的一个信号是，公司内外的很多开发者都在用 ChatGPT 帮他们调试非常复杂的问题。我们清楚地看到，人们正想方设法把越来越多的上下文（代码片段、错误堆栈）喂给 ChatGPT。

这些交互变得越来越复杂，直到某个时刻我们意识到：嘿，与其让用户来主导这件事，**为什么不让模型自己来主导交互，自己去寻找上下文，自己解决这个难题呢？**这样，你就可以坐下来，看着模型完成工作了。

正是这种交互模式的反转，促使我们更多地思考“配套工具”，赋予模型行动的能力。

Greg Brockman: 我们迭代了不同的产品形态。今年年初，我们有几种不同的方案。有异步的、智能体式的配套工具，也有本地的体验。我们内部甚至有一个叫 10X 的工具，完全在终端里运行，因为它给我们带来了十倍的生产力提升。我们当时觉得这还不够完善，所以没有作为产品发布。

Thibault Sottiaux: 现在，我们又回过头来，把这种智能体的能力带回你的终端和集成开发环境 (IDE)。我们真正想做对的，是创造一个与你并肩工作的实体，一个合作者，并把它带到你已经习惯使用的开发工具中。

未来的雏形：与 AI 协作的N种方式

Greg Brockman: 我认为我们已经看到了未来的轮廓。很明显，你未来会想要一个拥有自己电脑的 AI，它能运行，能把任务委派给一个智能体舰队，并行解决多个问题。

你早上醒来，一边喝咖啡，一边回答你的智能体提出的问题，给它一些反馈，比如“哦，这个不太对，不是我想要的”。这样的工作流是必然会发生的。

Thibault Sottiaux: 但现实是，很多人的开发环境配置非常复杂，可能只在他们自己的笔记本电脑上才能运行。我们希望能够利用这一点，走到开发者身边，让他们不需要为 Codex 做任何特殊配置，就能轻松体验到一个强大的编程智能体的威力。

Andrew Mayne: 现在我面临的问题是，当我坐下来工作时，我该用命令行工具 (CLI)，还是用 VS Code 插件？

Thibault Sottiaux: 我们现在仍在试验阶段。我们发现，高手用户更喜欢在终端里处理复杂的自动化工作流，而在处理具体文件或项目时，则更偏爱在 IDE 里操作，因为界面更友好，可以撤销，可以清晰地看到修改。

Greg Brockman: 我认为未来的方向是将这些工具更紧密地整合起来。最终，我们的愿景是，应该有一个 AI，它既能访问自己的云端计算机集群，也能像坐在你旁边一样，随时在本地帮助你。这些不应该是割裂的东西。

Thibault Sottiaux: 对，它就像一个统一的编程实体，随时准备帮助你、与你协作。就像我和 Greg 合作，我不会抱怨他有时在 Slack 上，有时我们当面聊，有时通过 GitHub 的代码审查交流。这在与人类合作时显得非常自然，这也是我们对 Codex 的设想。

`agents.md`：给AI写一份说明书

Andrew Mayne: 你们能解释一下 agents.md 是什么吗？

Thibault Sottiaux: agents.md 是一个你可以提供给 Codex 的指令集文件，它和你的代码放在一起。这样 Codex 就能获得更多关于如何更好地理解代码和完成任务的上下文。我们发现，在里面放两样东西特别有用：一是代码库的导航指南，帮助智能体更高效地探索，而不是遍历所有文件；二是个人偏好，比如“测试文件应该放在这里”，或者“我喜欢用这种方式做事”。

Greg Brockman: 这背后有一个很根本的问题：你如何向一个毫无背景的智能体传达你的意图和偏好？我们为人类写 readme.md，而 agents.md 就是为智能体准备的。当然，现在的智能体记性不太好，这是我们需要通过研究解决的问题，让智能体能够通过探索和记忆，真正深入理解你的代码库。

GPT-5 Codex 登场：更强韧、更敏捷

Andrew Mayne: 我们现在迎来了 GPT-5 的发布，随之而来的是 GPT-5 Codex。先生们，我为什么应该对此感到兴奋？

Thibault Sottiaux: GPT-5 Codex 是我们为 Codex 配套工具特别优化过的 GPT-5 版本。我们把它看作一个整体，模型和工具集紧密耦合。

它变得更可靠了。这个模型展现出一种能长时间持续工作的能力，在处理复杂重构任务时拥有你所需要的那种毅力。我们见过它在内部为了完成一次复杂的代码重构，连续工作了长达 7 个小时。我们从未在其他模型上见过这种情况。

与此同时，对于简单的任务，它的反应速度快得多，几乎无需过多思考就能给出答复。它的代码质量也得到了极大的提升。

Greg Brockman: 我觉得最了不起的是这些模型的核心智能，简直令人惊叹。我觉得，即使是三到六个月前，我们的模型在浏览我们内部代码库方面就已经比我强了。但这并不会让我觉得自己要被淘汰了。我不会因为“擅长在代码库里找东西”来定义我作为工程师的价值。

现在，这个强大的智能可以帮我处理掉所有那些单调乏味的部分。我可以选择如何分配我的时间，我可以思考如何分解任务，指挥这些智能体去完成。我把它看作是为程序员扩展了机会的边界。

展望2030：人机协同的新纪元

Andrew Mayne: 你们认为这一切会走向何方？智能体的未来会是怎样？

Thibault Sottiaux: 我们坚信，未来的方向是庞大的智能体集群在云端运行，而我们人类、团队和组织则负责监督和引导它们，以创造巨大的经济价值。几年后，数以百万计的智能体将在数据中心为我们工作。

现在的关键问题是，如何逐步达到那里？以及如何确保这一切的安全、可控和对齐 (alignment)。这就是为什么 Codex CLI 默认在沙盒环境中运行，以防它随意修改你电脑上的文件。

Greg Brockman: 我认为 Thibault 说得完全正确。在技术层面，我们需要解决很多问题，比如“可扩展的监督 (scalable oversight)”。当你有大量智能体在写代码时，你如何信任它们，而不需要阅读每一行代码？

但还有更宏大的图景。我们至今还未真正看到 AI 解决那些极其困难的、全新的问题。现在我们用它来重构代码，但未来呢？想象一下，在医药领域研发新药，在材料科学领域创造具有新特性的材料。

对我来说，一个重要的里程碑将是：AI 第一次创造出一件本身就极具价值和趣味性的东西。不是因为它由 AI 创造，也不是因为它成本更低，而仅仅因为它本身就是一个突破。我们已经开始在生命科学领域看到这种迹象，GPT-5 的表现已经达到了博士生研究员的水平，这太疯狂了。

Andrew Mayne: 那么 2030 年会是什么样子？

Greg Brockman: 我想，我们将进入一个物质极大丰富的世界。AI 将使创造任何你想要的东西变得超乎想象地容易。但这很可能也会是一个计算资源绝对稀缺的世界。

我们已经在 OpenAI 内部感受到了这一点。研究项目的成功很大程度上取决于计算资源的分配。未来，你创造力的瓶颈，部分在于你的想象力，另一部分就在于背后的算力。如果每个人都想拥有一个专属的智能体持续为自己工作，那我们可能需要将近 100 亿个 GPU。我们离这个数量级还差得很远。

终极问题：我们还应该学编程吗？

Thibault Sottiaux: 我认为现在是学习编程的绝佳时机。

Greg Brockman: 我同意。一定要学编程，但更要学会使用 AI。

Thibault Sottiaux: 用 Codex 学习一门新的编程语言，比如 Rust，是一种非常愉快的体验。我们团队很多人都是 Rust 新手，但借助 Codex，他们能快速上手，提出问题，探索陌生的代码库，并取得出色的成果。

Greg Brockman: 我回想起自己学编程的方式，是通过看各种在线教程。我曾经为了序列化数据，自己发明了一套笨拙的方法，用一串特殊字符做分隔符，完全没考虑过数据本身就包含这串字符怎么办。

如果是今天，Codex 的代码审查功能会直接告诉我：“嘿，有现成的 JSON 序列化库，用这个就行了。”它能回答那些你甚至不知道该去问的问题。这就是为什么我认为，现在是前所未有地适合创造和构建的时代。

最后的思考

Thibault Sottiaux: 自从发布以来，Codex 的使用量增长了超过 10 倍。我们看到越来越多的用户开始进行更复杂的尝试，使用时间也更长了。

Greg Brockman: 我认为，当人们真正理解了该如何使用 GPT-5 和它的配套工具后，一切就开始“咔哒”一下豁然开朗，然后他们就能以惊人的速度前进。我们很高兴看到这一切的发生，指数级的进步仍在继续。将这些工具带给每一个人，让它们变得可用、有用，是我们使命的核心。

Thibault Sottiaux: 谢谢邀请。现在，我感觉自己每天跟 Codex 交流的时间比跟大多数人还多。它是我真切感受到 AGI 的方式，我希望更多人能从中受益。