翻译

翻译的一些我觉得不错的科技文章。


提示词工程:技术分类与提示词微调[译]

作为一个新兴的研究领域,提示词工程尚未有明确的技术分类。当你查看各种讨论这些技术的文章和网站时,你会发现它们风格各异,且缺乏系统性。因此,实践者通常会采用最简单的方法。在本文中,我将为提示词工程技术提供一个概览,并提出一个清晰的分类,这将帮助你更好地理解这些概念并有效应用它们。此外,我还将探讨如何将提示词工程作为一个数据科学过程进行,其中包括提示词微调和评估。

September 28, 2024

View Article

为什么未来属于通才[译]

在 AI 时代,懂一点多领域知识比只懂一个领域的深度知识更有价值

September 28, 2024

View Article

Sam Altman:新发布的推理模型 o1 preview 相当于 GPT-2 时刻,但是升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻 [译]

在 2024 年 T-Mobile Capital Markets Day 上,OpenAI CEO Sam Altman 的一段访谈。OpenAI 新发布的推理模型 o1 preview 相当于 GPT-2 时刻,但是升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻。AI 的五个发展阶段。第一个阶段是聊天机器人。第二个阶段,也就是我们现在刚刚达到的,是推理系统。第三阶段是 AI 智能体。第四阶段是创新者,具有发现新科学信息的能力。第五阶段是完整的组织。从第一阶段过渡到第二阶段花费了一段时间,第二阶段能相对较快地推动第三阶段 AI 智能体的发展。OpenAI 不会用 API 调用的数据后者训练的数据来训练他们的模型。OpenAI 成功的秘诀是因为有坚定的信念和保持专注,能保持研究方向的聚焦。坚信深度学习的力量,相信可以从现有的状态一路走到通用人工智能(AGI)甚至更远,尽最大努力做得最好,并试图保持研究方向的聚焦。与此同时,会根据前进过程中学到的新知识来调整方向。尽全力去完成每一个任务,随着时间的推移,就能产生积累效应。看好未来 AI 在医疗保健领域、教育领域和科学研究领域上的贡献。

September 19, 2024

View Article

对 OpenAI o1 的逆向工程[译]

通过生产化测试时间计算揭示 AI 的未来。探索已经在语言模型训练中应用。

September 17, 2024

View Article

Anthropic 如何构建 Artifacts [译]

Artifacts 背后的团队——一种与 Claude 互动的新颖方式——分享了他们如何在三个月内通过分布式团队打造这一功能的独家细节。

August 29, 2024

View Article

我们如何构建 Townie——一个能够生成全栈应用的应用程序 [译]

Townie 在过去的几周内已经彻底重新设计。它在编写全栈应用方面非常厉害。这篇文章讲述了我几周前是如何为这个新版的 Townie 制作原型的。

August 24, 2024

View Article

《你是一个有用的邮件助理》和其他 Apple Intelligence 指示 [译]

一些用于 Apple 即将推出的 AI 功能的预提示说明存储在你的 Mac 上,这些说明要求“不要生成虚假信息”和避免“负面”主题。

August 6, 2024

View Article

在 Character.AI 的提示词设计 [译]

在 Character.AI,掌握提示词工程的艺术与科学至关重要。在实际应用中构建提示词需要考虑广泛的数据和因素:当前的对话模式、正在进行的实验、所涉及的角色、聊天类型、各种用户属性、固定记忆、用户角色、整个对话历史等等。鉴于我们每天构建数十亿条提示词、需要最大化利用不断扩展的大语言模型(LLM)上下文窗口,以及我们的用例多样性,一个强大且可扩展的提示词设计方法是必不可少的。我们倡导从传统的“提示词工程”转向“提示词设计”——这种转变使我们远离繁琐的字符串操作,转而设计精确且引人入胜的提示词。这篇文章介绍了我们开发的 Prompt Poet,一个专门解决提示词设计问题的工具。

August 2, 2024

View Article

引入 Cohere 提示词优化器:提示词优化触手可及 [译]

Cohere Prompt Tuner 使用可定制的优化和评估循环来改进 LLM Prompt,基于 Google Deepmind 的论文 OPRO (Optimization by Prompting) 方法,使用 LLM 驱动的评估结果来迭代优化 Prompts。

July 31, 2024

View Article

介绍 SAM 2:下一代 Meta 视频和图像分割模型 [译]

今天,我们宣布了 Meta Segment Anything Model 2(SAM 2),这是 Meta Segment Anything Model 的下一代产品,现在支持在视频和图像中进行对象分割。我们在 Apache 2.0 许可证下发布了 SAM 2,因此任何人都可以使用它来构建自己的体验。我们还共享了用于构建 SAM 2 的数据集 SA-V,并在 CC BY 4.0 许可证下发布,还推出了一个基于网页的演示体验,人人都可以试用我们模型的一个版本。

July 30, 2024

View Article

构建生成式 AI 平台 [译]

在研究了公司如何部署生成式 AI 应用程序后,我注意到它们的平台有许多相似之处。本文概述了生成式 AI 平台的常见组件、它们的功能以及如何实现。我尽量保持架构的通用性,但某些应用程序可能会有所不同。以下是总体架构的样子。

July 30, 2024

View Article

提示词注入 VS 越狱:有什么区别? [译]

我一直认为_提示词注入_是诱导模型做坏事,而_越狱_是特意诱导它做出违反公司服务条款的事情,通常是在聊天机器人中(因此,越狱是提示词注入的一部分)。但最近在 X 上的一次对话彻底改变了我的想法。我将从我对这些概念的新理解开始,因为这可能是你最关心的内容。然后,我会介绍那次改变我看法的对话,最后是我如何形成错误观点的过程。

July 29, 2024

View Article

大语言模型的工作原理,无需数学解释 [译]

我认为很多人对 GenAI 革命有一个基本疑问,那就是这些模型表面上展示的智能究竟来自哪里。在本文中,我将尝试用简单的术语解释生成式 AI 模型的工作原理,而不使用高级数学,帮助你将它们看作计算机算法,而不是魔法。

July 29, 2024

View Article

实战经验:在 GoDaddy 运营 LLM 中学到的 10 个教训 [译]

自从 ChatGPT 于 2022 年 12 月发布以来,GoDaddy 在 AI 方面进行了大量投资。在此期间,我们在众多项目中利用大语言模型(LLM)帮助客户创建网站内容、社交营销活动、设计标志,甚至为他们的项目找到最佳域名。我的团队——数字关怀团队,利用 LLM 在我们的消息渠道(短信、WhatsApp 和网络)中提供卓越的客户体验。GoDaddy 每天在我们的消息渠道中收到超过 60,000 个客户联系。许多对话开始于与我们某个机器人进行互动。我们对 LLM 技术在客户支持中的应用充满了期待和兴奋。早期实验表明,LLM 的表现优于旧的自然语言处理单元;然而,运营 LLM 并非易事。我们在运营这些模型的过程中学到了很多经验教训,这篇文章讨论了这些发现。

July 28, 2024

View Article

构建生成式 AI 产品的思考 [译]

在过去的六个月里,我们在 LinkedIn 的团队一直在努力开发一种新的 AI 驱动体验。我们希望重新定义会员们进行工作搜索和浏览专业内容的方式。

July 28, 2024

View Article

Crowdstrike 分析 [译]

这次 Windows 蓝屏是一个由于 C++ 语言的不安全内存导致的空指针问题。

July 20, 2024

View Article

使用视觉语言模型进行 PDF 检索 [译]

近年来,随着大语言模型 (LLM) 的发展,构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合,应用于专有知识数据库。然而,对于开发人员来说,一个主要挑战是将各种文档格式(如 PDF、HTML 等)转换为可供文本模型处理的格式。

July 17, 2024

View Article

The GraphRAG Manifesto: 为生成式 AI 增加知识 - 图数据库与分析 [译]

利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究

July 12, 2024

View Article

OpenAI 联合创始人 Andrej Karpathy 在 2024 年加州大学伯克利分校人工智能黑客马拉松颁奖典礼上的主题演讲 [译]

OpenAI 联合创始人 Andrej Karpathy 解释了新的计算范式:“我们正在进入一个新的计算范式,大语言模型就像 CPU 一样,使用 Token 而不是字节,并且有一个上下文窗口而不是 RAM。这就是大语言模型操作系统(Large Language Model OS, LLMOS)。”

July 3, 2024

View Article

马克·扎克伯格前几天接受了 Robin Kallaway 的采访,讨论了未来的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用 [译]

马克·扎克伯格前几天接受了 Robin Kallaway 的采访,讨论了未来的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用

June 30, 2024

View Article

升级到 GPT-4o 后使用提示词的五项调整 [译]"

ChatGPT 比以前更好用了,但我发现要想最大限度地利用它,您必须对现在的提示方式与使用 GPT-3.5 时的提示方式进行 5 项调整。我们将介绍 GPT-4o 的新功能,以及您的提示需要如何更新。

June 24, 2024

View Article

蔡崇信谈为什么阿里巴巴全力投入 AI [译]

这是今年五月蔡崇信在 2024 年摩根大通全球中国峰会期间炉边会谈的视频。在与关金星的 30 分钟对话中,蔡崇信概述了人工智能如何推动他 25 年前共同创立的公司在核心电商业务或云部门的增长。

June 23, 2024

View Article

HeyGen CEO 徐卓(Joshua Xu)访谈 [译]

AI 视频生成模型在制作引人入胜和复杂视频方面还有很长的路要走,但 HeyGen 团队正在通过使用语言、视频和语音模型来简化视频制作过程,从而创建包含个性化头像、插图(b-roll)和对话的视频。本周在“No Priors”节目中,HeyGen 的联合创始人兼 CEO Joshua Xu 加入了 Sarah 和 Elad 的讨论,介绍 HeyGen 团队如何分解视频的各个元素,并为每个元素构建或找到相应的模型,这些 AI 视频的商业应用,以及他们如何防范深度伪造(deep fakes)。

June 23, 2024

View Article

AI 是功能还是产品? [译]

The new Siri vs the RabbitR1 and Humane pin

June 22, 2024

View Article

优化 Character.AI 的 AI 推理 [译]

在 Character.AI,我们正朝着通用人工智能 (AGI) 的目标迈进。在未来,大语言模型 (LLMs) 将会增强我们的日常生活,不仅提高商业生产力和娱乐效果,还能在教育、教练、支持、头脑风暴、创意写作等方面提供帮助。要在全球实现这一愿景,关键在于实现高效的“推理”,即 LLM 生成回复的过程。作为一家全栈 AI 公司,Character.AI 从头开始设计其模型架构、推理架构和产品,创造了独特的机会来优化推理,使其更高效、更具成本效益,并能扩展以满足快速增长的全球用户需求。

June 21, 2024

View Article

在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代 [译]

毫无疑问,人工智能 (AI) 将对工作产生影响。但是,哪些工作更有可能被 AI 替代?哪些工作现在已经在被 AI 替代?为了找到答案,我决定查看实实在在的数据:从 2022 年 11 月 1 日(ChatGPT 发布前一个月)到 2024 年 2 月 14 日,Upwork 上的实际自由职业工作数据,看看哪些工作受到了最大的负面影响。

June 21, 2024

View Article

人工智能无处不在:改变世界,赋予人类力量 [译]

达特茅斯工程学院与校友、OpenAI 首席技术官 Mira Murati Th'12 举行了一场独家对话。她讨论了 ChatGPT 和 DALL·E 背后的人工智能(AI),以及正在进行的安全和伦理考量及未来的影响。

June 21, 2024

View Article

黃仁勳旋風席捲台灣 方念華獨家專訪!

黃仁勳旋風席捲台灣 方念華獨家專訪!Exclusive Interview with NVIDIA CEO Jensen Huang 20240616 (完整版)

June 19, 2024

View Article

发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程 [译]

我叫 Yufeng,我在 Google 担任工程师。我对设计提示词感兴趣的最初动机是因为从语言模型中获取有用的回应需要花费大量时间。有时候,我们甚至在不使用 AI 的情况下也能更快地完成工作。我希望能使我们的工具更加高效,而不是效率更低。我很高兴能帮助你更深入地了解如何设计有效的提示词。

June 19, 2024

View Article

苹果新推出的设备内及云端服务器基础模型介绍 [译]

在 2024 年全球开发者大会上,我们向大家展示了苹果智能系统,这是一套深度融入 iOS 18、iPadOS 18 及 macOS Sequoia 的个人智能体系。这一系统集成了多个功能强大的生成式 AI,专为处理用户日常需求而设计,能够根据用户当前的活动实时调整。苹果智能中的基础模型经过专门微调,以优化各种用户体验,如文本编写、通知的排序与摘要、为家庭及朋友对话创造有趣的图像,以及简化应用间的交互操作。

June 11, 2024

View Article

探索检索和评估相关上下文的挑战 [译]

利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究

June 11, 2024

View Article

最佳论文 [译]

虽然这篇文章的标题称其为“最佳论文”,但实际上并非如此。我的目标是探索一篇真正的最佳论文应具备的特质。

June 11, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 [译]

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。

June 9, 2024

View Article

什么是提示词注入攻击? [译]

我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件,甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法,包括数据审查、最小权限原则、人类反馈强化学习等。

June 5, 2024

View Article

NVIDIA 公布了到 2027 年的 GPU 和互连路线图 [译]

在计算、网络和图形的发展历史上,Nvidia 有许多独特之处。此刻,它拥有大量资金,并且凭借其架构、工程和供应链在生成式 AI (generative AI) 市场中占据了领先地位,使其能够随心所欲地制定任何可能带来进展的路线图。

June 4, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第二部分)[译]

运营大语言模型应用程序提出了一些在运营传统软件系统时熟悉的问题,但通常有新的变化来保持新鲜感。大语言模型应用程序还提出了全新的问题。我们将这些问题及其答案分为四部分:数据、模型、产品和团队。

June 4, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。

May 30, 2024

View Article

谷歌搜索秘籍泄漏:揭秘内部工程文档 [译]

探索你一直渴望了解的谷歌算法的秘密。

May 29, 2024

View Article

数千份谷歌搜索 API 的泄露文件曝光,SEO 从业者必看 [译]

2024 年 5 月 5 日,我收到一封电子邮件,发件人称得到谷歌搜索部门大量泄漏的 API 文档集的访问权限。邮件还提到,这些泄露文件已经得到前谷歌员工的验证,证实其真实性,并且这些前员工及其他人还透露了更多关于谷歌搜索操作的秘密信息。

May 28, 2024

View Article

映射大语言模型的思维 [译]

今天,我们在理解 AI 模型内部机制方面取得了重大突破。我们已经识别出数百万个概念在 Claude Sonnet(一种我们部署的大语言模型)中的表示方式。这是首次对现代生产级大语言模型的内部进行详细研究。这一发现有助于未来提升 AI 模型的安全性。

May 21, 2024

View Article

使用 NSFW 聊天机器人模拟人类 - 与 Jesse Silver 对话 [译]

利用开源的大语言模型 (LLM) 和 DSPy 技术来缓解提示注入问题,我们开发了迄今为止最先进的 AI 电子商务聊天机器人,使 OnlyFans 网红的收入提高了 2-5 倍。

May 18, 2024

View Article

你好 GPT-4o [译]

GPT-4o(“o”代表“omni 全方位”)能够实时处理音频、视觉和文本信息,使人机交互更加自然流畅。这款模型支持多种输入(文本、音频、图像)和输出(文本、音频、图像)模式,其响应音频的速度极快,最快可达 232 毫秒,平均响应时间为 320 毫秒,与人类在对话中的反应速度相当。无论是处理英语文本还是代码,GPT-4o 的表现堪比 GPT-4 Turbo,而在处理非英语文本方面则有了显著提升,同时运行速度更快,API 成本也减少了 50%。特别是在视觉和音频理解方面,GPT-4o 表现远超以往模型。

May 14, 2024

View Article

AlphaFold 3 揭示生命分子的秘密结构及其相互作用 - Isomorphic 实验室 [译]

Isomorphic 实验室和谷歌 DeepMind 共同开发的最新 AI 模型 AlphaFold 3,能够准确预测蛋白质、DNA、RNA 及配体等生命分子的结构及其相互作用,我们期待这一成果将深刻变革我们对生物世界与药物开发的理解。

May 8, 2024

View Article

ChatGPT 提示词十级技巧:从新手到专家 [译]

欢迎加入我们,深入探讨从基础到高级的 10 级 ChatGPT 提示工程技术。从基本的提示格式入手,逐步学习使用角色化技术,再进一步掌握如思维链 (Chain of Thought, CoT) 等更复杂的技术。在目前的工作中,我努力最大限度地提高从 GPT-4 及其他大语言模型 (Large Language Models, LLMs) 获取的准确性和实用性。我已经投入了数十小时研究学术论文和数百小时的模型提示实践,这个视频是我将这些经验压缩成 9 分钟分享的尝试。希望这个视频能为你带来启发。如果你有任何疑问,欢迎在评论区留言,我会确保回答你的问题!

May 6, 2024

View Article

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

深度探索我在驾驭大语言模型(LLMs)中学到的策略

May 6, 2024

View Article

Sam Altman 在斯坦福创业者思维领导研讨会上的对话 [译]

Sam Altman 在与斯坦福大学兼职讲师拉维 - 贝拉尼(Ravi Belani)的对话中,阿尔特曼为有抱负的人工智能创业者提供了建议,并分享了他对人工智能工具和人工通用智能的机遇与风险的见解。

May 3, 2024

View Article

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

大语言模型的接口:大语言模型广受欢迎的一个重要原因在于,其文本到文本的接口极其简单,用户可以轻松使用。在早期,使用深度学习解决一个任务通常需要对模型进行微调,通过数据训练使其掌握解决该任务的方法。而且,这些模型大都只专注于单一任务。但是,大语言模型具备了通过文本提示解决多种问题的能力,这种在上下文中的学习能力使得原本复杂的问题解决方式转变为自然语言的形式!

May 2, 2024

View Article

每家大语言模型公司都在挑战搜索技术:未来的大语言模型检索系统展望 [译]

搜索技术是计算机科学中极具挑战性的领域之一,仅有少数产品如 Google、Amazon 和 Instagram 能够做到出色。直至不久前,大多数产品并不依赖高效的搜索功能——它并非用户体验的关键部分。然而,随着大语言模型及其检索系统的迅猛发展,每个大语言模型公司都迫切需要将顶尖的搜索功能融入产品中,以确保其正常运作。面对这种新兴的需求,新一代 AI 公司将如何解决搜索问题?检索功能是大语言模型系统不可或缺的组成部分,这一点未来也不会改变。

May 2, 2024

View Article

Perplexity 产品开发的新模式 [译]

Perplexity 的联合创始人兼产品负责人 Johnny Ho 分享了他如何借助 AI 技术领导团队,如同指挥黏菌一般,构建他们的 AI 公司,以及更多前沿策略

May 2, 2024

View Article

提高提示一致性的结构化生成方法 [译]

最近,Hugging Face 的 *Leaderboards and Evals* 研究团队进行了一系列小实验,揭示了评估结果对提示格式微小变化的极高敏感性。对于特定任务,即使是很小的提示变动也会导致结果大不相同,这并非我们所希望看到的:相同信息输入的模型,其输出应保持一致性。我们与 *Dottxt* 的合作伙伴探讨了这一问题,他们提出了一个新思路:是否有办法提升不同提示格式之间的一致性?现在,让我们来详细探讨这一点。

May 1, 2024

View Article