翻译

翻译的一些我觉得不错的科技文章。


介绍 SAM 2:下一代 Meta 视频和图像分割模型 [译]

今天,我们宣布了 Meta Segment Anything Model 2(SAM 2),这是 Meta Segment Anything Model 的下一代产品,现在支持在视频和图像中进行对象分割。我们在 Apache 2.0 许可证下发布了 SAM 2,因此任何人都可以使用它来构建自己的体验。我们还共享了用于构建 SAM 2 的数据集 SA-V,并在 CC BY 4.0 许可证下发布,还推出了一个基于网页的演示体验,人人都可以试用我们模型的一个版本。

July 30, 2024

View Article

构建生成式 AI 平台 [译]

在研究了公司如何部署生成式 AI 应用程序后,我注意到它们的平台有许多相似之处。本文概述了生成式 AI 平台的常见组件、它们的功能以及如何实现。我尽量保持架构的通用性,但某些应用程序可能会有所不同。以下是总体架构的样子。

July 30, 2024

View Article

提示词注入 VS 越狱:有什么区别? [译]

我一直认为_提示词注入_是诱导模型做坏事,而_越狱_是特意诱导它做出违反公司服务条款的事情,通常是在聊天机器人中(因此,越狱是提示词注入的一部分)。但最近在 X 上的一次对话彻底改变了我的想法。我将从我对这些概念的新理解开始,因为这可能是你最关心的内容。然后,我会介绍那次改变我看法的对话,最后是我如何形成错误观点的过程。

July 29, 2024

View Article

大语言模型的工作原理,无需数学解释 [译]

我认为很多人对 GenAI 革命有一个基本疑问,那就是这些模型表面上展示的智能究竟来自哪里。在本文中,我将尝试用简单的术语解释生成式 AI 模型的工作原理,而不使用高级数学,帮助你将它们看作计算机算法,而不是魔法。

July 29, 2024

View Article

实战经验:在 GoDaddy 运营 LLM 中学到的 10 个教训 [译]

自从 ChatGPT 于 2022 年 12 月发布以来,GoDaddy 在 AI 方面进行了大量投资。在此期间,我们在众多项目中利用大语言模型(LLM)帮助客户创建网站内容、社交营销活动、设计标志,甚至为他们的项目找到最佳域名。我的团队——数字关怀团队,利用 LLM 在我们的消息渠道(短信、WhatsApp 和网络)中提供卓越的客户体验。GoDaddy 每天在我们的消息渠道中收到超过 60,000 个客户联系。许多对话开始于与我们某个机器人进行互动。我们对 LLM 技术在客户支持中的应用充满了期待和兴奋。早期实验表明,LLM 的表现优于旧的自然语言处理单元;然而,运营 LLM 并非易事。我们在运营这些模型的过程中学到了很多经验教训,这篇文章讨论了这些发现。

July 28, 2024

View Article

构建生成式 AI 产品的思考 [译]

在过去的六个月里,我们在 LinkedIn 的团队一直在努力开发一种新的 AI 驱动体验。我们希望重新定义会员们进行工作搜索和浏览专业内容的方式。

July 28, 2024

View Article

Crowdstrike 分析 [译]

这次 Windows 蓝屏是一个由于 C++ 语言的不安全内存导致的空指针问题。

July 20, 2024

View Article

使用视觉语言模型进行 PDF 检索 [译]

近年来,随着大语言模型 (LLM) 的发展,构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合,应用于专有知识数据库。然而,对于开发人员来说,一个主要挑战是将各种文档格式(如 PDF、HTML 等)转换为可供文本模型处理的格式。

July 17, 2024

View Article

The GraphRAG Manifesto: 为生成式 AI 增加知识 - 图数据库与分析 [译]

利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究

July 12, 2024

View Article

OpenAI 联合创始人 Andrej Karpathy 在 2024 年加州大学伯克利分校人工智能黑客马拉松颁奖典礼上的主题演讲 [译]

OpenAI 联合创始人 Andrej Karpathy 解释了新的计算范式:“我们正在进入一个新的计算范式,大语言模型就像 CPU 一样,使用 Token 而不是字节,并且有一个上下文窗口而不是 RAM。这就是大语言模型操作系统(Large Language Model OS, LLMOS)。”

July 3, 2024

View Article

马克·扎克伯格前几天接受了 Robin Kallaway 的采访,讨论了未来的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用 [译]

马克·扎克伯格前几天接受了 Robin Kallaway 的采访,讨论了未来的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用

June 30, 2024

View Article

升级到 GPT-4o 后使用提示词的五项调整 [译]"

ChatGPT 比以前更好用了,但我发现要想最大限度地利用它,您必须对现在的提示方式与使用 GPT-3.5 时的提示方式进行 5 项调整。我们将介绍 GPT-4o 的新功能,以及您的提示需要如何更新。

June 24, 2024

View Article

蔡崇信谈为什么阿里巴巴全力投入 AI [译]

这是今年五月蔡崇信在 2024 年摩根大通全球中国峰会期间炉边会谈的视频。在与关金星的 30 分钟对话中,蔡崇信概述了人工智能如何推动他 25 年前共同创立的公司在核心电商业务或云部门的增长。

June 23, 2024

View Article

HeyGen CEO 徐卓(Joshua Xu)访谈 [译]

AI 视频生成模型在制作引人入胜和复杂视频方面还有很长的路要走,但 HeyGen 团队正在通过使用语言、视频和语音模型来简化视频制作过程,从而创建包含个性化头像、插图(b-roll)和对话的视频。本周在“No Priors”节目中,HeyGen 的联合创始人兼 CEO Joshua Xu 加入了 Sarah 和 Elad 的讨论,介绍 HeyGen 团队如何分解视频的各个元素,并为每个元素构建或找到相应的模型,这些 AI 视频的商业应用,以及他们如何防范深度伪造(deep fakes)。

June 23, 2024

View Article

AI 是功能还是产品? [译]

The new Siri vs the RabbitR1 and Humane pin

June 22, 2024

View Article

优化 Character.AI 的 AI 推理 [译]

在 Character.AI,我们正朝着通用人工智能 (AGI) 的目标迈进。在未来,大语言模型 (LLMs) 将会增强我们的日常生活,不仅提高商业生产力和娱乐效果,还能在教育、教练、支持、头脑风暴、创意写作等方面提供帮助。要在全球实现这一愿景,关键在于实现高效的“推理”,即 LLM 生成回复的过程。作为一家全栈 AI 公司,Character.AI 从头开始设计其模型架构、推理架构和产品,创造了独特的机会来优化推理,使其更高效、更具成本效益,并能扩展以满足快速增长的全球用户需求。

June 21, 2024

View Article

在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代 [译]

毫无疑问,人工智能 (AI) 将对工作产生影响。但是,哪些工作更有可能被 AI 替代?哪些工作现在已经在被 AI 替代?为了找到答案,我决定查看实实在在的数据:从 2022 年 11 月 1 日(ChatGPT 发布前一个月)到 2024 年 2 月 14 日,Upwork 上的实际自由职业工作数据,看看哪些工作受到了最大的负面影响。

June 21, 2024

View Article

人工智能无处不在:改变世界,赋予人类力量 [译]

达特茅斯工程学院与校友、OpenAI 首席技术官 Mira Murati Th'12 举行了一场独家对话。她讨论了 ChatGPT 和 DALL·E 背后的人工智能(AI),以及正在进行的安全和伦理考量及未来的影响。

June 21, 2024

View Article

黃仁勳旋風席捲台灣 方念華獨家專訪!

黃仁勳旋風席捲台灣 方念華獨家專訪!Exclusive Interview with NVIDIA CEO Jensen Huang 20240616 (完整版)

June 19, 2024

View Article

发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程 [译]

我叫 Yufeng,我在 Google 担任工程师。我对设计提示词感兴趣的最初动机是因为从语言模型中获取有用的回应需要花费大量时间。有时候,我们甚至在不使用 AI 的情况下也能更快地完成工作。我希望能使我们的工具更加高效,而不是效率更低。我很高兴能帮助你更深入地了解如何设计有效的提示词。

June 19, 2024

View Article

苹果新推出的设备内及云端服务器基础模型介绍 [译]

在 2024 年全球开发者大会上,我们向大家展示了苹果智能系统,这是一套深度融入 iOS 18、iPadOS 18 及 macOS Sequoia 的个人智能体系。这一系统集成了多个功能强大的生成式 AI,专为处理用户日常需求而设计,能够根据用户当前的活动实时调整。苹果智能中的基础模型经过专门微调,以优化各种用户体验,如文本编写、通知的排序与摘要、为家庭及朋友对话创造有趣的图像,以及简化应用间的交互操作。

June 11, 2024

View Article

探索检索和评估相关上下文的挑战 [译]

利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究

June 11, 2024

View Article

最佳论文 [译]

虽然这篇文章的标题称其为“最佳论文”,但实际上并非如此。我的目标是探索一篇真正的最佳论文应具备的特质。

June 11, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 [译]

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。

June 9, 2024

View Article

什么是提示词注入攻击? [译]

我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件,甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法,包括数据审查、最小权限原则、人类反馈强化学习等。

June 5, 2024

View Article

NVIDIA 公布了到 2027 年的 GPU 和互连路线图 [译]

在计算、网络和图形的发展历史上,Nvidia 有许多独特之处。此刻,它拥有大量资金,并且凭借其架构、工程和供应链在生成式 AI (generative AI) 市场中占据了领先地位,使其能够随心所欲地制定任何可能带来进展的路线图。

June 4, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第二部分)[译]

运营大语言模型应用程序提出了一些在运营传统软件系统时熟悉的问题,但通常有新的变化来保持新鲜感。大语言模型应用程序还提出了全新的问题。我们将这些问题及其答案分为四部分:数据、模型、产品和团队。

June 4, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。

May 30, 2024

View Article

谷歌搜索秘籍泄漏:揭秘内部工程文档 [译]

探索你一直渴望了解的谷歌算法的秘密。

May 29, 2024

View Article

数千份谷歌搜索 API 的泄露文件曝光,SEO 从业者必看 [译]

2024 年 5 月 5 日,我收到一封电子邮件,发件人称得到谷歌搜索部门大量泄漏的 API 文档集的访问权限。邮件还提到,这些泄露文件已经得到前谷歌员工的验证,证实其真实性,并且这些前员工及其他人还透露了更多关于谷歌搜索操作的秘密信息。

May 28, 2024

View Article

映射大语言模型的思维 [译]

今天,我们在理解 AI 模型内部机制方面取得了重大突破。我们已经识别出数百万个概念在 Claude Sonnet(一种我们部署的大语言模型)中的表示方式。这是首次对现代生产级大语言模型的内部进行详细研究。这一发现有助于未来提升 AI 模型的安全性。

May 21, 2024

View Article

使用 NSFW 聊天机器人模拟人类 - 与 Jesse Silver 对话 [译]

利用开源的大语言模型 (LLM) 和 DSPy 技术来缓解提示注入问题,我们开发了迄今为止最先进的 AI 电子商务聊天机器人,使 OnlyFans 网红的收入提高了 2-5 倍。

May 18, 2024

View Article

你好 GPT-4o [译]

GPT-4o(“o”代表“omni 全方位”)能够实时处理音频、视觉和文本信息,使人机交互更加自然流畅。这款模型支持多种输入(文本、音频、图像)和输出(文本、音频、图像)模式,其响应音频的速度极快,最快可达 232 毫秒,平均响应时间为 320 毫秒,与人类在对话中的反应速度相当。无论是处理英语文本还是代码,GPT-4o 的表现堪比 GPT-4 Turbo,而在处理非英语文本方面则有了显著提升,同时运行速度更快,API 成本也减少了 50%。特别是在视觉和音频理解方面,GPT-4o 表现远超以往模型。

May 14, 2024

View Article

AlphaFold 3 揭示生命分子的秘密结构及其相互作用 - Isomorphic 实验室 [译]

Isomorphic 实验室和谷歌 DeepMind 共同开发的最新 AI 模型 AlphaFold 3,能够准确预测蛋白质、DNA、RNA 及配体等生命分子的结构及其相互作用,我们期待这一成果将深刻变革我们对生物世界与药物开发的理解。

May 8, 2024

View Article

ChatGPT 提示词十级技巧:从新手到专家 [译]

欢迎加入我们,深入探讨从基础到高级的 10 级 ChatGPT 提示工程技术。从基本的提示格式入手,逐步学习使用角色化技术,再进一步掌握如思维链 (Chain of Thought, CoT) 等更复杂的技术。在目前的工作中,我努力最大限度地提高从 GPT-4 及其他大语言模型 (Large Language Models, LLMs) 获取的准确性和实用性。我已经投入了数十小时研究学术论文和数百小时的模型提示实践,这个视频是我将这些经验压缩成 9 分钟分享的尝试。希望这个视频能为你带来启发。如果你有任何疑问,欢迎在评论区留言,我会确保回答你的问题!

May 6, 2024

View Article

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

深度探索我在驾驭大语言模型(LLMs)中学到的策略

May 6, 2024

View Article

Sam Altman 在斯坦福创业者思维领导研讨会上的对话 [译]

Sam Altman 在与斯坦福大学兼职讲师拉维 - 贝拉尼(Ravi Belani)的对话中,阿尔特曼为有抱负的人工智能创业者提供了建议,并分享了他对人工智能工具和人工通用智能的机遇与风险的见解。

May 3, 2024

View Article

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

大语言模型的接口:大语言模型广受欢迎的一个重要原因在于,其文本到文本的接口极其简单,用户可以轻松使用。在早期,使用深度学习解决一个任务通常需要对模型进行微调,通过数据训练使其掌握解决该任务的方法。而且,这些模型大都只专注于单一任务。但是,大语言模型具备了通过文本提示解决多种问题的能力,这种在上下文中的学习能力使得原本复杂的问题解决方式转变为自然语言的形式!

May 2, 2024

View Article

每家大语言模型公司都在挑战搜索技术:未来的大语言模型检索系统展望 [译]

搜索技术是计算机科学中极具挑战性的领域之一,仅有少数产品如 Google、Amazon 和 Instagram 能够做到出色。直至不久前,大多数产品并不依赖高效的搜索功能——它并非用户体验的关键部分。然而,随着大语言模型及其检索系统的迅猛发展,每个大语言模型公司都迫切需要将顶尖的搜索功能融入产品中,以确保其正常运作。面对这种新兴的需求,新一代 AI 公司将如何解决搜索问题?检索功能是大语言模型系统不可或缺的组成部分,这一点未来也不会改变。

May 2, 2024

View Article

Perplexity 产品开发的新模式 [译]

Perplexity 的联合创始人兼产品负责人 Johnny Ho 分享了他如何借助 AI 技术领导团队,如同指挥黏菌一般,构建他们的 AI 公司,以及更多前沿策略

May 2, 2024

View Article

提高提示一致性的结构化生成方法 [译]

最近,Hugging Face 的 *Leaderboards and Evals* 研究团队进行了一系列小实验,揭示了评估结果对提示格式微小变化的极高敏感性。对于特定任务,即使是很小的提示变动也会导致结果大不相同,这并非我们所希望看到的:相同信息输入的模型,其输出应保持一致性。我们与 *Dottxt* 的合作伙伴探讨了这一问题,他们提出了一个新思路:是否有办法提升不同提示格式之间的一致性?现在,让我们来详细探讨这一点。

May 1, 2024

View Article

Rabbit R1: 几乎无法评测 [译]

这就是 Rabbit R1,它是一个装在盒子里的 AI,可以说是时代的象征。这个设备和 Humane AI Pin 有许多相似之处,不论是好是坏。不过,它也有两个所谓的独特之处,这些特点使它与 Humane AI Pin 区别开来。不管怎样,我们需要讨论一下这个问题。如果你觉得听起来熟悉,随时打断我,看看这个。

April 30, 2024

View Article

我们得聊聊 Rabbit R1 这款设备... [译]

这个视频主要介绍和点评了一款名为 Rabbit R1 的人工智能硬件助手。作者认为,作为一款售价 200 美元的消费级产品,R1 在设计和功能上还存在诸多不足之处,如滚轮交互体验欠佳、屏幕和音频表现一般、电池续航短等。同时,作者质疑 R1 这类 AI 硬件助手的实用价值,认为类似功能完全可以通过手机上的软件应用来实现。展望未来,作者预测一旦科技巨头们在自家移动操作系统中原生集成类似的 AI 助手功能,第三方的 AI 硬件设备将難以与之竞争。作者呼吁,硬件厂商在发布产品前应该给予评测者和消费者足够的时间去全面体验,不要盲目追赶所谓的"发布窗口期"。与其囿于硬件形态,不如把更多精力投入到底层 AI 技术的研发中来。

April 29, 2024

View Article

7 个帮助最小化 RAG 模型风险的指标 [译]

今天我们要学习如何使用关键指标评估 RAG。

April 29, 2024

View Article

Ilya——塑造世界的人工智能科学家 [译]

如今,AI 是一项伟大的科技,因为 AI 将解决我们现在面临的所有问题。它能解决就业问题,能治疗疾病,能消除贫困,但同时它也会带来新的问题。假新闻将会愈演愈烈,网络攻击将变得更加严重,我们将面临全自动的 AI 武器的问题。我认为 AI 有潜力创造出无比稳定的独裁统治。

April 28, 2024

View Article

No Priors 第 61 集 | 采访 OpenAI 的 Sora 团队负责人 Aditya Ramesh、Tim Brooks 和 Bill Peebles [译]

嗨,亲爱的听众们。欢迎收听"No Priors"的另一期节目。今天,我们有幸与 OpenAI 的 Sora 团队进行交谈,Sora 是一种新的生成式视频模型,能够接受一段文本提示词,然后返回一段视频剪辑高清、视觉连贯的,长达一分钟。Sora 也引起了人们的思考,即这些大规模的视频模型是否是世界模拟器,同时它把可扩展的 Transformer 架构应用到了视频领域。我们今天的嘉宾就是 Sora 的团队成员们。Aditya Ramesh、Tim Brooks 和 Bill Peebles。欢迎来到"No Priors",各位。

April 26, 2024

View Article

实际使用 SORA [译]

2024 年 2 月,我们首次报道了 OpenAI 发布的 SORA,当时我们将其形容为视频领域的 DALL·E。SORA 是一个生成时间更长、内容更连贯的视频的扩散模型。OpenAI 通过使模型能预见多帧内容,成功解决了视频主体即便短暂消失也能保持连贯性的技术难题。目前,SORA 能够一次性生成长达一分钟的完整视频。OpenAI 还表示,未来可能进一步扩展视频的长度,甚至实现两段视频的无缝连接。

April 26, 2024

View Article

台积电在美国郊区建造芯片工厂的艰辛历程 [译]

工期延误以及台湾和美国同事之间的紧张关系正在困扰着这家芯片巨头在凤凰城的扩张。

April 25, 2024

View Article

Meta 宣布推出 Llama 3 [译]

Meta 宣布推出 Llama 3 的介绍视频文稿,里面介绍了很多 Llama 3 的细节。

April 24, 2024

View Article

从一个卡车司机到 38 岁成为 Ruby on Rails 开发者 [译]

从这篇文章讲述了 Pedro David Garcia Lopez 的转变故事,他在 38 岁高龄从卡车司机转职成为了一个 Ruby on Rails 开发者,挑战了业界对年龄的固有偏见完全是无稽之谈!Pedro 的经历在 LinkedIn 上激励了我。

April 23, 2024

View Article