与 Devin 相处一个月的思考 [译]
我们在给 Devin 分配了 20 多个任务后的感受。
January 18, 2025
View Article翻译的一些我觉得不错的科技文章。
我们在给 Devin 分配了 20 多个任务后的感受。
January 18, 2025
View Article从类人对话体验到语音定制与无障碍性,了解如何打造更智能、更以用户为中心的聊天机器人。
January 18, 2025
View Article随着构建 AI 产品的成本下降,对懂得该构建什么的人才的需求将会上升。准备好迎接 AI 产品管理的爆发式增长吧!
January 16, 2025
View Article如果我告诉你 GPT-5 是真实存在的呢?不仅真实存在,而且它已经在你看不到的地方塑造着世界。基本假设是:OpenAI 已经开发出 GPT-5,但把它留在内部使用,因为这样获得的回报远远大于开放给数百万 ChatGPT 用户使用。而且他们获得的回报**并不是金钱**,而是别的东西。你看,这个想法本身很简单;难点在于如何把零碎的信息拼凑起来,形成完整的推断。本文将深入探讨我为什么认为所有线索都指向这个结论。
January 16, 2025
View Article如今为什么会有这么多免费且好用的托管服务。多年前,你_必须_付费才能拥有托管服务,但现在已经有了很多免费额度相当大的平台,比如 GitHub Pages、GitLab Pages、Netlify 等等。但在免费方案之中,Cloudflare 一骑绝尘
January 16, 2025
View Article在大多数垂直领域中,横向 AI 产品最终会胜过垂直 AI 产品。垂直 AI 虽先入市场,但谁能在长期中取胜?
January 16, 2025
View Article关于加强美国在人工智能基础设施领域领导地位的行政命令
January 15, 2025
View Article十年亲身经验:从受雇软件开发者到成功独立开发者,打造并运营自己的业务
January 14, 2025
View Article2025 年 1 月 8 日的东京地区 Scrum Gathering 大会上所做主题演讲的文字记录。
January 13, 2025
View Article尽管我的第一台电脑是 Apple II,但我从来不是 Macintosh 用户,因为我家后来转用了 PC。不过通过阅读各种杂志,我对 Macintosh 这一系列的电脑也逐渐熟悉,并一直想给收藏添一台运行在 pre-OSX(OS X 之前版本)的 Macintosh。阻碍我的主要原因是,大多数老 Mac 都使用较为“奇葩”的接口,而且我也没有足够的空间来放置它们。
January 13, 2025
View Article我为什么会从厌恶 o1,到现在每天用它来解决最重要的问题?因为我学会了如何正确使用它。
January 13, 2025
View Article* 在历史上,通用方法总能在 AI 领域取胜。 * 目前从事 AI 应用的创业者正在重蹈过去 AI 研究者的错误。 * 更好的 AI 模型将催生通用型 AI 应用,同时,围绕 AI 模型的“套壳软件”价值将逐渐降低。
January 12, 2025
View Article自从两年前 ChatGPT 面向公众推出以来,我们就被各种关于大型语言模型和生成式人工智能潜在益处及威胁的极端论调所淹没。无论是支持者还是批评者,都认为这项技术的出现是人类历史的一个拐点。
January 10, 2025
View Article在这篇文章中,我想试着勾勒一下这种“极大利好”可能是什么样子——即,如果一切顺利,拥有强大人工智能的世界会如何。当然,没人能够以绝对确定或精确的方式预知未来,而强大人工智能的影响可能比过去的技术变革更难以预测,因此以下内容不可避免地是一些猜测。但我希望至少能给出有依据、有用的猜测——能抓住未来可能发生的“风格”,即使其中大多数细节最终错了。我之所以会包含许多细节,主要是因为我认为,比起高度保留、抽象的陈述,一个相对具象、具体的未来愿景更有助于推动讨论。
January 10, 2025
View Article作为一个在新项目发布后会持续关注的人,我认为为大家整理出一份“特别值得注意的项目”列表会很有帮助。我从一些非正式的“评分”维度来挑选它们,这些维度包括功能性(独特性等)、社区反馈以及开发活跃度。
January 10, 2025
View Article实际上,人工智能的进展并未停滞——它只是变得对大多数人而言“隐形”了。
January 9, 2025
View Article使用 AI 辅助编程来构建软件原型,是快速探索各种创意并发明新事物的重要方式。在这篇文章以及后续的帖子中,我想与大家分享一些构建简单 Web 应用原型的最佳实践。本篇文章将聚焦一个核心理念:选择并熟悉一个“有主见”的软件技术栈。
January 9, 2025
View Article作为我最后的一篇专业帖子,我想回顾一下 Marc Andressen 在 2011 年发表的奠基性文章《为什么软件正在吞噬世界》。我曾深信其中的每一个字,甚至还写了一本书——《B = mc²》,来探讨我对数字化转型的看法。三年前,当我为了退休而转向经营我的第一家企业时,我梦想能进一步探索数字革命。可惜我对未来一无所知……
January 9, 2025
View Article我曾是一个“优化成瘾者”。过去几年里,我花了大量时间纠结于自己做出的每一个决定,因为我觉得自己必须要做“最好的”事情——不是一般的好,也不是不错,而是道德上最好的那种。
January 9, 2025
View Article现在,许多应用开始直接在设备上集成 AI 模型。对于需要频繁推理的场景(比如即时照片滤镜或实时物体检测),这种方式非常好,能够提供速度和离线访问。并且,由于任何在你设备上运行的东西都可以被设备访问,对于那些好奇想一探究竟的人来说,现在正是一个黄金机会。
January 9, 2025
View Article一份实战指南,以及为何我们需要重新审视自己的期望
January 8, 2025
View Article本文档总结了我在过去一年中使用生成式模型进行编程的个人经验。我要强调,这并不是一个被动的过程。为了更好地了解这些模型的潜力,我有意识地在编程时寻找机会使用它们。结果就是,现在我在工作时经常使用 LLM,并且我认为它们对我的生产力有正向提升。(每当我尝试回到没有它们的编程方式时,都会感觉非常不适。)
January 7, 2025
View Article在过去一年中,我们与各行各业数十个团队合作,帮助他们基于大型语言模型(LLM)构建 Agent。我们发现,最成功的实现并不依赖复杂的框架或专业化的库,而是使用了简单且可组合的模式。
January 7, 2025
View Article2024 年,大型语言模型领域发生了*很多*事情。接下来是对过去十二个月里我们对该领域所了解内容的回顾,以及我对其中关键主题和重大时刻的梳理。
January 3, 2025
View ArticleCursor 提示手册
December 29, 2024
View Article生物群体往往利用集体智慧共同应对挑战,但若协调不佳则会削弱群体认知的效能。要检验集体认知是否超过个体认知,往往并不容易,因为不同组织层级通常面临的是不同的问题。而“将大型物体穿越复杂环境并运送至目标位置”的难题却是一个例外:无论是蚂蚁还是人类,都擅长单独或协同完成这一任务。这样一来,我们得以在跨物种、跨群体规模的层面上,将解题能力及认知特点进行少见的直接对比。在本研究中,我们让人类和蚂蚁同时面对同一个“搬钢琴(piano-movers)”式的大型负载搬运谜题。结果发现:蚂蚁群体规模越大,搬运效率越高;而人类则恰恰相反。进一步发现,单只蚂蚁虽无法理解谜题的整体结构,但牠们的集体运动却能形成新颖的涌现认知技能:通过集体排列的有序状态来短期记忆移动方向,从而提升群体的解题能力。相比之下,人类对谜题有更清晰的全局认知,因此能够减少搜寻空间,平均表现优于蚂蚁。然而,一旦限制了人类之间的交流,人类群体就会退而采取最显而易见的动作以达到共识,这种做法颇似蚂蚁的行为模式,却对解题效率产生负面影响。我们的研究说明:简单大脑的个体更易在群体中实现能力可伸缩性,而复杂大脑则需要充分而复杂的交流才能在合作中保持高效。
December 26, 2024
View Article了解如何使用 GitHub Copilot 来生成单元测试,并查看具体示例、教程以及最佳实践。
December 24, 2024
View Article是的,我承认这是一个很炫的标题。但想想看——最初只是简单的自动完成建议,如今却演变成了功能强大的东西:我们已经拥有了可以实时生成整段函数、搭建完整文件并提供合理的架构,甚至能从零开始引导整个代码库的 AI。它们已经从帮助敲代码的小助手,变成了协作式的编码伙伴。
December 24, 2024
View Article最近,Appier 研究团队发表了一篇论文 [《让我自由表达?关于格式限制对大语言模型性能影响的研究》](https://arxiv.org/abs/2408.02442),对大语言模型(LLM)在执行结构化生成任务时的评估结果质量提出了严重指控。
November 22, 2024
View Article一位身无分文的失业小哥,和父母住在一起。在2020年那一年,他看准AI是个风口,决定全力投入。在父母的卧室里,他创办了一家价值3500万美元的AI初创公司。现在公司的年收入已经达到800万美元,还在不断增长中。
November 9, 2024
View ArticleAI 编程助手正在进入原属于人类程序员的代码领域。这些 AI 系统真的会全面接管软件开发吗?
November 2, 2024
View ArticleRAG中的5种文本切分策略,直观解释!在RAG系统中,切分是指将大文档划分为较小、可管理的部分,称为“切片”。这一过程提高了检索的效率和准确性,直接改善了生成响应的质量。
October 22, 2024
View Article程序员 John Resig(JQuery 库作者)遇上了一件烦心事。他想完成一些兴趣项目(side projects),却发现在保证全职工作效率的前提下,很难推进。他常在每个周末疯狂赶工,力求完成更多,但压力和焦虑感总是爆棚,状态难以维系。有一天,在他人启发下,John 决定换一种策略:每天写代码。原本用整个周末投入兴趣项目,如今拆分到每一天,花不少于 30 分钟编程。半年后,他发现新策略产生了神奇的效果,他取得了超多成果:开发多个新网站、重写若干个框架、完成大量新模块。更重要的是,曾经困扰他的焦虑感,也烟消云散。
October 22, 2024
View Article了解批量处理智能体工作负载的电子表格用户体验、生成式 UI 以及与智能体协作的用户体验。
October 11, 2024
View Article我们将讨论后台运行的智能体,它可以同时处理多个任务,并探讨它们如何应用于您的工作流程。
October 11, 2024
View Article人与计算机的交互已经研究了很多年。我相信在未来几年,人与智能体的交互也将成为一个重要的研究领域。
October 11, 2024
View Article智能体规划的意义以及如何提升规划能力。
October 11, 2024
View Article了解为什么你应该根据应用定制认知架构,并运行更好的智能体应用基础设施。
October 11, 2024
View Article“认知架构”一词在神经科学和计算认知科学中有着 悠久的历史 。根据维基百科的定义,“认知架构”既指关于人类思维结构的理论,也指该理论的计算实现。这一定义(以及相关的研究和文章)比我在此提出的定义更全面,本篇博文应被视为我在过去一年中构建和帮助构建基于大语言模型(LLM)的应用程序经验与该研究领域的映射。
October 11, 2024
View Article💡智能体是一个使用大语言模型(LLM)来决定应用程序控制流的系统。
October 11, 2024
View Article本文深入探讨了生成式AI的新阶段,揭示了从“快速反应”到“深度推理”的转变趋势。随着微软、OpenAI等科技巨头在AI基础层的主导地位日益稳固,未来的焦点将转向AI推理能力的提升,比如OpenAI的最新模型o1,它具备在推理时“停下来思考”的能力,不再仅仅依赖预训练数据的模式匹配。这一推理能力的进化将引领AI进入全新的智能应用时代,帮助AI解决复杂任务,创造巨大市场机会。文章还指出,未来AI或将实现类似AlphaGo超人表现的突破,真正展现出接近人类思维的能力。
October 10, 2024
View Article作为一个新兴的研究领域,提示词工程尚未有明确的技术分类。当你查看各种讨论这些技术的文章和网站时,你会发现它们风格各异,且缺乏系统性。因此,实践者通常会采用最简单的方法。在本文中,我将为提示词工程技术提供一个概览,并提出一个清晰的分类,这将帮助你更好地理解这些概念并有效应用它们。此外,我还将探讨如何将提示词工程作为一个数据科学过程进行,其中包括提示词微调和评估。
September 28, 2024
View Article在 AI 时代,懂一点多领域知识比只懂一个领域的深度知识更有价值
September 28, 2024
View Article在 2024 年 T-Mobile Capital Markets Day 上,OpenAI CEO Sam Altman 的一段访谈。OpenAI 新发布的推理模型 o1 preview 相当于 GPT-2 时刻,但是升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻。AI 的五个发展阶段。第一个阶段是聊天机器人。第二个阶段,也就是我们现在刚刚达到的,是推理系统。第三阶段是 AI 智能体。第四阶段是创新者,具有发现新科学信息的能力。第五阶段是完整的组织。从第一阶段过渡到第二阶段花费了一段时间,第二阶段能相对较快地推动第三阶段 AI 智能体的发展。OpenAI 不会用 API 调用的数据后者训练的数据来训练他们的模型。OpenAI 成功的秘诀是因为有坚定的信念和保持专注,能保持研究方向的聚焦。坚信深度学习的力量,相信可以从现有的状态一路走到通用人工智能(AGI)甚至更远,尽最大努力做得最好,并试图保持研究方向的聚焦。与此同时,会根据前进过程中学到的新知识来调整方向。尽全力去完成每一个任务,随着时间的推移,就能产生积累效应。看好未来 AI 在医疗保健领域、教育领域和科学研究领域上的贡献。
September 19, 2024
View Article通过生产化测试时间计算揭示 AI 的未来。探索已经在语言模型训练中应用。
September 17, 2024
View ArticleArtifacts 背后的团队——一种与 Claude 互动的新颖方式——分享了他们如何在三个月内通过分布式团队打造这一功能的独家细节。
August 29, 2024
View ArticleTownie 在过去的几周内已经彻底重新设计。它在编写全栈应用方面非常厉害。这篇文章讲述了我几周前是如何为这个新版的 Townie 制作原型的。
August 24, 2024
View Article一些用于 Apple 即将推出的 AI 功能的预提示说明存储在你的 Mac 上,这些说明要求“不要生成虚假信息”和避免“负面”主题。
August 6, 2024
View Article在 Character.AI,掌握提示词工程的艺术与科学至关重要。在实际应用中构建提示词需要考虑广泛的数据和因素:当前的对话模式、正在进行的实验、所涉及的角色、聊天类型、各种用户属性、固定记忆、用户角色、整个对话历史等等。鉴于我们每天构建数十亿条提示词、需要最大化利用不断扩展的大语言模型(LLM)上下文窗口,以及我们的用例多样性,一个强大且可扩展的提示词设计方法是必不可少的。我们倡导从传统的“提示词工程”转向“提示词设计”——这种转变使我们远离繁琐的字符串操作,转而设计精确且引人入胜的提示词。这篇文章介绍了我们开发的 Prompt Poet,一个专门解决提示词设计问题的工具。
August 2, 2024
View ArticleCohere Prompt Tuner 使用可定制的优化和评估循环来改进 LLM Prompt,基于 Google Deepmind 的论文 OPRO (Optimization by Prompting) 方法,使用 LLM 驱动的评估结果来迭代优化 Prompts。
July 31, 2024
View Article