翻译

翻译的一些我觉得不错的科技文章。

以 DeepSeek R1 为例学习“推理型大语言模型 [译]

**导读：** 这是一篇相当棒的科普文章，作者以 DeepSeek R1 为核心案例，围绕“推理型大语言模型（Reasoning LLMs）”这一主题，深入探讨了其定义、应用场景、优劣势及主要实现方法。文章背景是 2024 年以来大型语言模型在专业化方向上的快速发展，尤其在解题、数学证明、代码生成等需要多步推理的复杂任务上，如何用RL（强化学习）和SFT（监督微调）等方法打造“会思考”的模型。文中还详细解读了 DeepSeek R1 模型训练流程，包括纯RL、SFT+RL、以及利用蒸馏将大模型能力迁移到小模型。作者还介绍了一些低成本项目，如 Sky-T1、TinyZero 等，为有限资源下的研究者提供了新思路。通过这一系列方法对比，读者可以全面了解构建推理模型的关键技术、挑战与未来趋势。

February 7, 2025

阿兰·图灵的神秘“Delilah”项目：被遗失的故事 [译]

图灵笔记中的独家内容，展现了他“动手实干”的工程方法

February 4, 2025

比尔·盖茨：特朗普、马斯克，以及我的神经多样性如何塑造了我 [译]

他在学校经常不及格，那么这位被称为“怪胎”的少年比尔·盖茨是如何创办微软并在 31 岁时成为亿万富翁的？

February 4, 2025

关于人工智能与人类智能关系的说明 [译]

来自梵蒂冈的关于人工智能与人类智能关系的说明

February 4, 2025

对 DeepSeek R1 的科普 [译]

这篇文章帮你把最近的 AI 发展梳理得明明白白。就是专门写给那些“感觉自己好像应该知道，但又真的没跟上节奏”的朋友们。AI 进化速度太离谱，我们要抱紧彼此，别在这股风潮里被吹晕。

January 27, 2025

英伟达股票的空头观点简析 [译]

But even though I've thought the valuation was just too rich for my blood for the past year or so, a confluence of recent developments has caused me to flip a bit to my usual instinct, which is to be a bit more contrarian in outlook and to question the consensus when it seems to be more than priced in. The saying "what the wise man believes in the beginning, the fool believes in the end" became famous for a good reason.

January 27, 2025

The AI PM's Playbook：2025 年顶尖产品经理如何将影响力提升 10 倍 [译]

大家都听过各种各样的“AI 在产品管理中的应用”说法。让我们去伪存真，看看最实用的用例、工具以及规则，帮助你在职场提升效率，同时又不损害你的口碑。

January 26, 2025

DeepSeek-V3 与 r1 中的异常 Token [译]

对 DeepSeek 出现的异常 Token 进行首次识别与归档的尝试

January 26, 2025

AGI前夜的思考 [译]

我们正生活在 AGI 的前夜。在这个“圣诞前夜”里，我请求你一起努力，让 AGI 的转变顺利进行。这样我才能在公元 3024 年的圣诞节前夜，和你在距离我们四光年的那颗围绕“Altman Centauri”运行的行星上说声“嗨”。

January 22, 2025

AI 初创公司最危险的做法：就是为其他 AI 初创公司构建产品 [译]

Codeium 如何在十个月内从 0 增长到超过 1000 万美元？enterpriseready.io 的盲区在哪？一次关于“企业级基础设施原生”（Enterprise Infra Native）的全面思维导图！

January 21, 2025

如何让 AI 的用户体验（UX）成为你的护城河 [译]

设计优秀的 AI 产品，超越“只是 LLM 封装”：让 AI 更加随处可见，更加实用，然后更加强大。

January 21, 2025

打造「Copilot for X」究竟需要什么？[译]

要想打造一个“Copilot for X”，你需要：估算推理规模：在延迟和输出质量之间做好权衡自己掌控模型：使用第三方 API 会毁了你的单位经济成本搞定实时基础设施：ChatGPT、DALL-E 等服务的速度对保持“流畅状态”来说太慢了优化 Prompt：上下文窗口非常有限；要判断哪些信息对输出提升效果最好整合模型输出与用户体验：原始模型输出往往直观度不足，你需要处理大量长尾的 UX 问题最终，你会想要超越“Copilot for X”的模式，因为 Copilot 只是 AI 产品化后各种可能模式的一个起点。

January 21, 2025

打断如何影响不同的软件工程活动？[译]

某些任务及其复杂度会改变打断的影响。研究还发现，认知与生理数据之间存在差异。

January 20, 2025

ChatGPT 的不平衡采用加剧了工人之间既有的不平等 [译]

通过一项大规模、具有代表性的调查，我们研究了谁已经采用了 ChatGPT、工人如何预期该技术将影响他们的工作，以及为什么有些工人使用它而有些人则不使用。我们的研究显示，ChatGPT 的采用障碍加剧了一些现有的不平等：女性和低收入工人使用该工具的可能性更小，而年轻和资历较浅的工人采用 ChatGPT 的速度更快。

January 19, 2025

与 Devin 相处一个月的思考 [译]

我们在给 Devin 分配了 20 多个任务后的感受。

January 18, 2025

超越机器人：在 AI 时代重新定义聊天机器人设计 [译]

从类人对话体验到语音定制与无障碍性，了解如何打造更智能、更以用户为中心的聊天机器人。

January 18, 2025

开发软件成本越来越低，但创意更值钱：AI 产品经理将炙手可热！[译]

随着构建 AI 产品的成本下降，对懂得该构建什么的人才的需求将会上升。准备好迎接 AI 产品管理的爆发式增长吧！

January 16, 2025

这则关于 GPT-5 的传言将改变一切 [译]

如果我告诉你 GPT-5 是真实存在的呢？不仅真实存在，而且它已经在你看不到的地方塑造着世界。基本假设是：OpenAI 已经开发出 GPT-5，但把它留在内部使用，因为这样获得的回报远远大于开放给数百万 ChatGPT 用户使用。而且他们获得的回报**并不是金钱**，而是别的东西。你看，这个想法本身很简单；难点在于如何把零碎的信息拼凑起来，形成完整的推断。本文将深入探讨我为什么认为所有线索都指向这个结论。

January 16, 2025

为什么 Cloudflare Pages 的免费套餐如此慷慨？[译]

如今为什么会有这么多免费且好用的托管服务。多年前，你_必须_付费才能拥有托管服务，但现在已经有了很多免费额度相当大的平台，比如 GitHub Pages、GitLab Pages、Netlify 等等。但在免费方案之中，Cloudflare 一骑绝尘

January 16, 2025

AI 创业者需要学习《苦涩的教训》：第二章 - 无护城河 [译]

在大多数垂直领域中，横向 AI 产品最终会胜过垂直 AI 产品。垂直 AI 虽先入市场，但谁能在长期中取胜？

January 16, 2025

关于加强美国在人工智能基础设施领域领导地位的行政命令 [译]

关于加强美国在人工智能基础设施领域领导地位的行政命令

January 15, 2025

使用编程技能赚取被动收入 [译]

十年亲身经验：从受雇软件开发者到成功独立开发者，打造并运营自己的业务

January 14, 2025

如果我们拥有世界上最好的产品工程组织，它会是什么样子？[译]

2025 年 1 月 8 日的东京地区 Scrum Gathering 大会上所做主题演讲的文字记录。

January 13, 2025

Mac Mini G4 —— 最佳「经典」Macintosh 来怀旧游戏 [译]

尽管我的第一台电脑是 Apple II，但我从来不是 Macintosh 用户，因为我家后来转用了 PC。不过通过阅读各种杂志，我对 Macintosh 这一系列的电脑也逐渐熟悉，并一直想给收藏添一台运行在 pre-OSX（OS X 之前版本）的 Macintosh。阻碍我的主要原因是，大多数老 Mac 都使用较为“奇葩”的接口，而且我也没有足够的空间来放置它们。

January 13, 2025

o1 不是一个聊天模型（这正是它的意义）[译]

我为什么会从厌恶 o1，到现在每天用它来解决最重要的问题？因为我学会了如何正确使用它。

January 13, 2025

AI 创业者需要学习《苦涩的教训》[译]

* 在历史上，通用方法总能在 AI 领域取胜。 * 目前从事 AI 应用的创业者正在重蹈过去 AI 研究者的错误。 * 更好的 AI 模型将催生通用型 AI 应用，同时，围绕 AI 模型的“套壳软件”价值将逐渐降低。

January 12, 2025

人工智能并非天才。我们才是天才 [译]

自从两年前 ChatGPT 面向公众推出以来，我们就被各种关于大型语言模型和生成式人工智能潜在益处及威胁的极端论调所淹没。无论是支持者还是批评者，都认为这项技术的出现是人类历史的一个拐点。

January 10, 2025

被仁慈所爱的机器——人工智能如何让世界变得更美好[译]

在这篇文章中，我想试着勾勒一下这种“极大利好”可能是什么样子——即，如果一切顺利，拥有强大人工智能的世界会如何。当然，没人能够以绝对确定或精确的方式预知未来，而强大人工智能的影响可能比过去的技术变革更难以预测，因此以下内容不可避免地是一些猜测。但我希望至少能给出有依据、有用的猜测——能抓住未来可能发生的“风格”，即使其中大多数细节最终错了。我之所以会包含许多细节，主要是因为我认为，比起高度保留、抽象的陈述，一个相对具象、具体的未来愿景更有助于推动讨论。

January 10, 2025

2024 年我最喜欢的新发布自托管应用 [译]

作为一个在新项目发布后会持续关注的人，我认为为大家整理出一份“特别值得注意的项目”列表会很有帮助。我从一些非正式的“评分”维度来挑选它们，这些维度包括功能性（独特性等）、社区反馈以及开发活跃度。

January 10, 2025

为什么人工智能的进展愈发“看不见” [译]

实际上，人工智能的进展并未停滞——它只是变得对大多数人而言“隐形”了。

January 9, 2025

吴恩达老师分享的用 AI 辅助编程快速打造软件原型的最佳实践

使用 AI 辅助编程来构建软件原型，是快速探索各种创意并发明新事物的重要方式。在这篇文章以及后续的帖子中，我想与大家分享一些构建简单 Web 应用原型的最佳实践。本篇文章将聚焦一个核心理念：选择并熟悉一个“有主见”的软件技术栈。

January 9, 2025

软件正在吞噬世界，……好吧[译]

作为我最后的一篇专业帖子，我想回顾一下 Marc Andressen 在 2011 年发表的奠基性文章《为什么软件正在吞噬世界》。我曾深信其中的每一个字，甚至还写了一本书——《B = mc²》，来探讨我对数字化转型的看法。三年前，当我为了退休而转向经营我的第一家企业时，我梦想能进一步探索数字革命。可惜我对未来一无所知……

January 9, 2025

你无法通过“优化”来成为一个好人 [译]

我曾是一个“优化成瘾者”。过去几年里，我花了大量时间纠结于自己做出的每一个决定，因为我觉得自己必须要做“最好的”事情——不是一般的好，也不是不错，而是道德上最好的那种。

January 9, 2025

如何从移动应用中提取 AI 模型文件

现在，许多应用开始直接在设备上集成 AI 模型。对于需要频繁推理的场景（比如即时照片滤镜或实时物体检测），这种方式非常好，能够提供速度和离线访问。并且，由于任何在你设备上运行的东西都可以被设备访问，对于那些好奇想一探究竟的人来说，现在正是一个黄金机会。

January 9, 2025

AI 辅助编码的残酷真相：它能帮你完成70%的工作，但最后30%令人非常沮丧

一份实战指南，以及为何我们需要重新审视自己的期望

January 8, 2025

我如何使用 LLM 进行编程 [译]

本文档总结了我在过去一年中使用生成式模型进行编程的个人经验。我要强调，这并不是一个被动的过程。为了更好地了解这些模型的潜力，我有意识地在编程时寻找机会使用它们。结果就是，现在我在工作时经常使用 LLM，并且我认为它们对我的生产力有正向提升。（每当我尝试回到没有它们的编程方式时，都会感觉非常不适。）

January 7, 2025

构建高效 Agent [译]

在过去一年中，我们与各行各业数十个团队合作，帮助他们基于大型语言模型（LLM）构建 Agent。我们发现，最成功的实现并不依赖复杂的框架或专业化的库，而是使用了简单且可组合的模式。

January 7, 2025

我们在 2024 年从大型语言模型中学到的事

2024 年，大型语言模型领域发生了*很多*事情。接下来是对过去十二个月里我们对该领域所了解内容的回顾，以及我对其中关键主题和重大时刻的梳理。

January 3, 2025

Cursor 常用提示词手册

Cursor 提示手册

December 29, 2024

对比蚂蚁与人类在协作式几何难题求解中的表现

生物群体往往利用集体智慧共同应对挑战，但若协调不佳则会削弱群体认知的效能。要检验集体认知是否超过个体认知，往往并不容易，因为不同组织层级通常面临的是不同的问题。而“将大型物体穿越复杂环境并运送至目标位置”的难题却是一个例外：无论是蚂蚁还是人类，都擅长单独或协同完成这一任务。这样一来，我们得以在跨物种、跨群体规模的层面上，将解题能力及认知特点进行少见的直接对比。在本研究中，我们让人类和蚂蚁同时面对同一个“搬钢琴（piano-movers）”式的大型负载搬运谜题。结果发现：蚂蚁群体规模越大，搬运效率越高；而人类则恰恰相反。进一步发现，单只蚂蚁虽无法理解谜题的整体结构，但牠们的集体运动却能形成新颖的涌现认知技能：通过集体排列的有序状态来短期记忆移动方向，从而提升群体的解题能力。相比之下，人类对谜题有更清晰的全局认知，因此能够减少搜寻空间，平均表现优于蚂蚁。然而，一旦限制了人类之间的交流，人类群体就会退而采取最显而易见的动作以达到共识，这种做法颇似蚂蚁的行为模式，却对解题效率产生负面影响。我们的研究说明：简单大脑的个体更易在群体中实现能力可伸缩性，而复杂大脑则需要充分而复杂的交流才能在合作中保持高效。

December 26, 2024

如何使用 GitHub Copilot 生成单元测试：技巧和示例

了解如何使用 GitHub Copilot 来生成单元测试，并查看具体示例、教程以及最佳实践。

December 24, 2024

AI 辅助编码特性与开发者交互模式的演变

是的，我承认这是一个很炫的标题。但想想看——最初只是简单的自动完成建议，如今却演变成了功能强大的东西：我们已经拥有了可以实时生成整段函数、搭建完整文件并提供合理的架构，甚至能从零开始引导整个代码库的 AI。它们已经从帮助敲代码的小助手，变成了协作式的编码伙伴。

December 24, 2024

生成结构化的内容（JSON模式）是否会影响 LLM 性能？[译]

最近，Appier 研究团队发表了一篇论文 [《让我自由表达？关于格式限制对大语言模型性能影响的研究》](https://arxiv.org/abs/2408.02442)，对大语言模型（LLM）在执行结构化生成任务时的评估结果质量提出了严重指控。

November 22, 2024

如何从0做到年收入500万美元的盈利（分步指南）[译]

一位身无分文的失业小哥，和父母住在一起。在2020年那一年，他看准AI是个风口，决定全力投入。在父母的卧室里，他创办了一家价值3500万美元的AI初创公司。现在公司的年收入已经达到800万美元，还在不断增长中。

November 9, 2024

程序员的未来：AI 是否会接管编程工作？[译]

AI 编程助手正在进入原属于人类程序员的代码领域。这些 AI 系统真的会全面接管软件开发吗？

November 2, 2024

RAG的5种切分策略 [译]

RAG中的5种文本切分策略，直观解释！在RAG系统中，切分是指将大文档划分为较小、可管理的部分，称为“切片”。这一过程提高了检索的效率和准确性，直接改善了生成响应的质量。

October 22, 2024

每天写代码 [译]

程序员 John Resig（JQuery 库作者）遇上了一件烦心事。他想完成一些兴趣项目（side projects），却发现在保证全职工作效率的前提下，很难推进。他常在每个周末疯狂赶工，力求完成更多，但压力和焦虑感总是爆棚，状态难以维系。有一天，在他人启发下，John 决定换一种策略：每天写代码。原本用整个周末投入兴趣项目，如今拆分到每一天，花不少于 30 分钟编程。半年后，他发现新策略产生了神奇的效果，他取得了超多成果：开发多个新网站、重写若干个框架、完成大量新模块。更重要的是，曾经困扰他的焦虑感，也烟消云散。

October 22, 2024

针对智能体的用户体验设计，第三部分：电子表格、生成式和协作式 UI/UX [译]

了解批量处理智能体工作负载的电子表格用户体验、生成式 UI 以及与智能体协作的用户体验。

October 11, 2024

针对智能体的用户体验设计，第二部分：后台运行[译]

我们将讨论后台运行的智能体，它可以同时处理多个任务，并探讨它们如何应用于您的工作流程。

October 11, 2024

针对智能体的用户体验设计，第一部分：聊天 [译]

人与计算机的交互已经研究了很多年。我相信在未来几年，人与智能体的交互也将成为一个重要的研究领域。

October 11, 2024