首页


测试 Chrome 内置 Gemini Nano 大语言模型 (4bit 3.25B) 的方法

如何测试 Chrome 内置的 Gemini Nano 大语言模型

June 8, 2024

View Article

问答:有校对好的视频文稿如何用文稿纠正字幕错误?

我有校对好的视频文稿,但是 Whisper 生成的字幕有错误,我该如何用文稿纠正字幕错误?

June 7, 2024

View Article

问答:如何使用 GPT 知道我写 R 代码?

我用文字描述的方式请教 copilot 指导我写 R 代码(科研作图用),但效果不好。与此同时我查到一现成的完美代码,但因为看不懂,无法根据实际情况调整,所以也无法复现。这个时候我想让 copilot 帮我协调一下,即用现成的代码基础上根据我的说明进行调整,promote 我应该一次性说清楚,还是分多次?

June 7, 2024

View Article

什么是提示词注入攻击? [译]

我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件,甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法,包括数据审查、最小权限原则、人类反馈强化学习等。

June 5, 2024

View Article

NVIDIA 公布了到 2027 年的 GPU 和互连路线图 [译]

在计算、网络和图形的发展历史上,Nvidia 有许多独特之处。此刻,它拥有大量资金,并且凭借其架构、工程和供应链在生成式 AI (generative AI) 市场中占据了领先地位,使其能够随心所欲地制定任何可能带来进展的路线图。

June 4, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第二部分)[译]

运营大语言模型应用程序提出了一些在运营传统软件系统时熟悉的问题,但通常有新的变化来保持新鲜感。大语言模型应用程序还提出了全新的问题。我们将这些问题及其答案分为四部分:数据、模型、产品和团队。

June 4, 2024

View Article

为什么对于有的人来说 ChatGPT 并没有什么卵用?

看到微博上一位医生这条被 ChatGPT-4o 坑的微博,尝试从技术角度解读一下,这样也许能更好的理解现阶段大语言模型的优缺点,在实际应用中能扬长避短。

June 2, 2024

View Article

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。

May 30, 2024

View Article

谷歌搜索秘籍泄漏:揭秘内部工程文档 [译]

探索你一直渴望了解的谷歌算法的秘密。

May 29, 2024

View Article

数千份谷歌搜索 API 的泄露文件曝光,SEO 从业者必看 [译]

2024 年 5 月 5 日,我收到一封电子邮件,发件人称得到谷歌搜索部门大量泄漏的 API 文档集的访问权限。邮件还提到,这些泄露文件已经得到前谷歌员工的验证,证实其真实性,并且这些前员工及其他人还透露了更多关于谷歌搜索操作的秘密信息。

May 28, 2024

View Article

映射大语言模型的思维 [译]

今天,我们在理解 AI 模型内部机制方面取得了重大突破。我们已经识别出数百万个概念在 Claude Sonnet(一种我们部署的大语言模型)中的表示方式。这是首次对现代生产级大语言模型的内部进行详细研究。这一发现有助于未来提升 AI 模型的安全性。

May 21, 2024

View Article

使用 NSFW 聊天机器人模拟人类 - 与 Jesse Silver 对话 [译]

利用开源的大语言模型 (LLM) 和 DSPy 技术来缓解提示注入问题,我们开发了迄今为止最先进的 AI 电子商务聊天机器人,使 OnlyFans 网红的收入提高了 2-5 倍。

May 18, 2024

View Article

你好 GPT-4o [译]

GPT-4o(“o”代表“omni 全方位”)能够实时处理音频、视觉和文本信息,使人机交互更加自然流畅。这款模型支持多种输入(文本、音频、图像)和输出(文本、音频、图像)模式,其响应音频的速度极快,最快可达 232 毫秒,平均响应时间为 320 毫秒,与人类在对话中的反应速度相当。无论是处理英语文本还是代码,GPT-4o 的表现堪比 GPT-4 Turbo,而在处理非英语文本方面则有了显著提升,同时运行速度更快,API 成本也减少了 50%。特别是在视觉和音频理解方面,GPT-4o 表现远超以往模型。

May 14, 2024

View Article

AlphaFold 3 揭示生命分子的秘密结构及其相互作用 - Isomorphic 实验室 [译]

Isomorphic 实验室和谷歌 DeepMind 共同开发的最新 AI 模型 AlphaFold 3,能够准确预测蛋白质、DNA、RNA 及配体等生命分子的结构及其相互作用,我们期待这一成果将深刻变革我们对生物世界与药物开发的理解。

May 8, 2024

View Article

ChatGPT 提示词十级技巧:从新手到专家 [译]

欢迎加入我们,深入探讨从基础到高级的 10 级 ChatGPT 提示工程技术。从基本的提示格式入手,逐步学习使用角色化技术,再进一步掌握如思维链 (Chain of Thought, CoT) 等更复杂的技术。在目前的工作中,我努力最大限度地提高从 GPT-4 及其他大语言模型 (Large Language Models, LLMs) 获取的准确性和实用性。我已经投入了数十小时研究学术论文和数百小时的模型提示实践,这个视频是我将这些经验压缩成 9 分钟分享的尝试。希望这个视频能为你带来启发。如果你有任何疑问,欢迎在评论区留言,我会确保回答你的问题!

May 6, 2024

View Article

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

深度探索我在驾驭大语言模型(LLMs)中学到的策略

May 6, 2024

View Article

Sam Altman 在斯坦福创业者思维领导研讨会上的对话 [译]

Sam Altman 在与斯坦福大学兼职讲师拉维 - 贝拉尼(Ravi Belani)的对话中,阿尔特曼为有抱负的人工智能创业者提供了建议,并分享了他对人工智能工具和人工通用智能的机遇与风险的见解。

May 3, 2024

View Article

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

大语言模型的接口:大语言模型广受欢迎的一个重要原因在于,其文本到文本的接口极其简单,用户可以轻松使用。在早期,使用深度学习解决一个任务通常需要对模型进行微调,通过数据训练使其掌握解决该任务的方法。而且,这些模型大都只专注于单一任务。但是,大语言模型具备了通过文本提示解决多种问题的能力,这种在上下文中的学习能力使得原本复杂的问题解决方式转变为自然语言的形式!

May 2, 2024

View Article

每家大语言模型公司都在挑战搜索技术:未来的大语言模型检索系统展望 [译]

搜索技术是计算机科学中极具挑战性的领域之一,仅有少数产品如 Google、Amazon 和 Instagram 能够做到出色。直至不久前,大多数产品并不依赖高效的搜索功能——它并非用户体验的关键部分。然而,随着大语言模型及其检索系统的迅猛发展,每个大语言模型公司都迫切需要将顶尖的搜索功能融入产品中,以确保其正常运作。面对这种新兴的需求,新一代 AI 公司将如何解决搜索问题?检索功能是大语言模型系统不可或缺的组成部分,这一点未来也不会改变。

May 2, 2024

View Article

Perplexity 产品开发的新模式 [译]

Perplexity 的联合创始人兼产品负责人 Johnny Ho 分享了他如何借助 AI 技术领导团队,如同指挥黏菌一般,构建他们的 AI 公司,以及更多前沿策略

May 2, 2024

View Article

提高提示一致性的结构化生成方法 [译]

最近,Hugging Face 的 *Leaderboards and Evals* 研究团队进行了一系列小实验,揭示了评估结果对提示格式微小变化的极高敏感性。对于特定任务,即使是很小的提示变动也会导致结果大不相同,这并非我们所希望看到的:相同信息输入的模型,其输出应保持一致性。我们与 *Dottxt* 的合作伙伴探讨了这一问题,他们提出了一个新思路:是否有办法提升不同提示格式之间的一致性?现在,让我们来详细探讨这一点。

May 1, 2024

View Article

Rabbit R1: 几乎无法评测 [译]

这就是 Rabbit R1,它是一个装在盒子里的 AI,可以说是时代的象征。这个设备和 Humane AI Pin 有许多相似之处,不论是好是坏。不过,它也有两个所谓的独特之处,这些特点使它与 Humane AI Pin 区别开来。不管怎样,我们需要讨论一下这个问题。如果你觉得听起来熟悉,随时打断我,看看这个。

April 30, 2024

View Article

我们得聊聊 Rabbit R1 这款设备... [译]

这个视频主要介绍和点评了一款名为 Rabbit R1 的人工智能硬件助手。作者认为,作为一款售价 200 美元的消费级产品,R1 在设计和功能上还存在诸多不足之处,如滚轮交互体验欠佳、屏幕和音频表现一般、电池续航短等。同时,作者质疑 R1 这类 AI 硬件助手的实用价值,认为类似功能完全可以通过手机上的软件应用来实现。展望未来,作者预测一旦科技巨头们在自家移动操作系统中原生集成类似的 AI 助手功能,第三方的 AI 硬件设备将難以与之竞争。作者呼吁,硬件厂商在发布产品前应该给予评测者和消费者足够的时间去全面体验,不要盲目追赶所谓的"发布窗口期"。与其囿于硬件形态,不如把更多精力投入到底层 AI 技术的研发中来。

April 29, 2024

View Article

7 个帮助最小化 RAG 模型风险的指标 [译]

今天我们要学习如何使用关键指标评估 RAG。

April 29, 2024

View Article

Ilya——塑造世界的人工智能科学家 [译]

如今,AI 是一项伟大的科技,因为 AI 将解决我们现在面临的所有问题。它能解决就业问题,能治疗疾病,能消除贫困,但同时它也会带来新的问题。假新闻将会愈演愈烈,网络攻击将变得更加严重,我们将面临全自动的 AI 武器的问题。我认为 AI 有潜力创造出无比稳定的独裁统治。

April 28, 2024

View Article

No Priors 第 61 集 | 采访 OpenAI 的 Sora 团队负责人 Aditya Ramesh、Tim Brooks 和 Bill Peebles [译]

嗨,亲爱的听众们。欢迎收听"No Priors"的另一期节目。今天,我们有幸与 OpenAI 的 Sora 团队进行交谈,Sora 是一种新的生成式视频模型,能够接受一段文本提示词,然后返回一段视频剪辑高清、视觉连贯的,长达一分钟。Sora 也引起了人们的思考,即这些大规模的视频模型是否是世界模拟器,同时它把可扩展的 Transformer 架构应用到了视频领域。我们今天的嘉宾就是 Sora 的团队成员们。Aditya Ramesh、Tim Brooks 和 Bill Peebles。欢迎来到"No Priors",各位。

April 26, 2024

View Article

实际使用 SORA [译]

2024 年 2 月,我们首次报道了 OpenAI 发布的 SORA,当时我们将其形容为视频领域的 DALL·E。SORA 是一个生成时间更长、内容更连贯的视频的扩散模型。OpenAI 通过使模型能预见多帧内容,成功解决了视频主体即便短暂消失也能保持连贯性的技术难题。目前,SORA 能够一次性生成长达一分钟的完整视频。OpenAI 还表示,未来可能进一步扩展视频的长度,甚至实现两段视频的无缝连接。

April 26, 2024

View Article

台积电在美国郊区建造芯片工厂的艰辛历程 [译]

工期延误以及台湾和美国同事之间的紧张关系正在困扰着这家芯片巨头在凤凰城的扩张。

April 25, 2024

View Article

Meta 宣布推出 Llama 3 [译]

Meta 宣布推出 Llama 3 的介绍视频文稿,里面介绍了很多 Llama 3 的细节。

April 24, 2024

View Article

从一个卡车司机到 38 岁成为 Ruby on Rails 开发者 [译]

从这篇文章讲述了 Pedro David Garcia Lopez 的转变故事,他在 38 岁高龄从卡车司机转职成为了一个 Ruby on Rails 开发者,挑战了业界对年龄的固有偏见完全是无稽之谈!Pedro 的经历在 LinkedIn 上激励了我。

April 23, 2024

View Article

硅谷女孩采访 Perplexity 创始人 Aravind [译]

遇见阿拉温德,这位来自印度的创新者,他辞去 OpenAI 的工作,决心要挑战 Google - 和玛丽娜·莫吉尔科的深入对话。新一代搜索引擎将会是什么样?让我们和阿拉温德·斯利尼瓦斯一起发现,他从印度来到美国,带着 AI 的力量来革新在线搜索体验。

April 22, 2024

View Article

DREAM: 分布式 RAG 实验框架 [译]

使用 Ray, LlamaIndex, Ragas, MLFlow 和 MinIO 在 Kubernetes 上的分布式 RAG 实验蓝图

April 20, 2024

View Article

RAG 在长上下文大语言模型 (LLM) 中的应用探讨 [译]

这是@rlancemartin 最近在几个聚会上关于在长上下文 LLM 时代使用 RAG 的讲座。随着上下文窗口增至超过 100 万 Token,很多人质疑 RAG 是否已经过时。我们结合几个最新的项目成果来分析这个问题。我们讨论了长上下文 LLM 在事实推理和信息检索方

April 19, 2024

View Article

介绍 Meta Llama 3:迄今为止最强大的开源大语言模型 [译]

今天,我们正在介绍 Meta Llama 3,我们最先进的开源大语言模型 (LLM) 的下一代。Llama 3 模型很快将在 AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM, 和 Snowflake 上可用,并得到 AMD, AWS, Dell, Intel, NVIDIA, 和 Qualcomm 提供的硬件平台的支持。

April 18, 2024

View Article

第 2 章:技术性能 —— 2024 年人工智能指数报告 [译]

本章的技术性能部分为您呈现了 2023 年 AI 的全面进展。起始于对 AI 技术性能的高层次概述,本文档记录了 AI 的逐步发展。接着,本章深入分析了当前在多个方面的 AI 能力,包括语言处理、编程、计算机视觉(图像和视频分析)、推理、音频处理、自治智能体、机器人以及强化学习 (reinforcement learning)。此外,本章还重点介绍了过去一年里 AI 研究的重大突破,讨论了如何通过提示、优化和微调来提升大语言模型的性能,并最终探讨了 AI 系统对环境的影响。

April 17, 2024

View Article

规划是 AI 智能体的一种核心设计模式[译]

规划是 AI 智能体的一种核心设计模式,其中我们利用大语言模型 (LLM) 自主选择一系列步骤,以完成一个较大的任务。比如,如果我们指派一个智能体去网上研究某个主题,我们可能就会用 LLM 帮助它将这个大任务拆分成若干小任务,例如具体研究几个子主题、整合研究成果、以及撰写报告。

April 16, 2024

View Article

Chapter 2: Technical Performance | 2024 AI Index Report

Overview The technical performance section of this year’s AI Index offers a comprehensive overview of AI advancements in 2023. It starts with a high-level overview of AI technical performance, tracing its broad evolution over time. The chapter then examines the current state of a wide range of AI capabilities, including language processing, coding, computer vision (image and video analysis), reasoning, audio processing, autonomous agents, robotics, and reinforcement learning. It also shines a spotlight on notable AI research breakthroughs from the past year, exploring methods for improving LLMs through prompting, optimization, and fine-tuning, and wraps up with an exploration of AI systems’ environmental footprint.

April 16, 2024

View Article

2024 年人工智能指数报告 —— 由斯坦福大学人工智能研究院发布 [译]

这份报告全面分析了 2023 年人工智能 (AI) 领域的进展,涵盖了技术进步、经济影响、政策制定和公众舆论等方面。

April 16, 2024

View Article

第 1 章:AI 研发 —— 2024 年人工智能指数报告 [译]

这份报告全面分析了 2023 年人工智能 (AI) 领域的进展,涵盖了技术进步、经济影响、政策制定和公众舆论等方面。

April 16, 2024

View Article

Chapter 1: Research and Development | 2024 AI Index Report

The figures below present the global count of English- and Chinese-language AI publications from 2010 to 2022, categorized by type of affiliation and cross-sector collaborations. Additionally, this section details publication data for AI journal articles and conference papers.

April 16, 2024

View Article

问答:在 RAG 应用中,GPT-3.5 足够就足够了吗?

问:请问这个观点对不对:“对于搭建企业本地知识库来说,比如使用 RAG 方式,国内几家大模型都可以胜任(用 gpt4 的话有点杀鸡用牛刀的意思),关键在于应用端的调教”?先说结论:我觉得没毛病,GPT 3.5 的能力就足够胜任绝大部分场景了,但 GPT-4 不是杀鸡牛刀,而是如虎添翼甚至化腐朽为神奇。

April 16, 2024

View Article

美国芯片制造的重大失误 [译]

ASML 正在推动一项可能是当前世界上最关键的技术——极紫外光刻技术 (extreme ultraviolet lithography machines)。如果没有这些价值两亿美元的 EUV 设备及其制造的半导体,人工智能革命就不会发生,全球经济也将开始陷入停滞。这些设备主要在荷兰生产,并销售给台湾的台积电和韩国的三星,而 Intel 却迟迟未能参与。在此同时,无论是在唐纳德·特朗普还是乔·拜登的任期内,美国政府都在努力不让这些设备落入中国手中。

April 15, 2024

View Article

福布斯采访 Perplexity 创始人:Perplexity 让你在互联网上找到更好的答案 [译]

Notion 是一款由人工智能驱动的生产力工具,正在向 Google Docs 和 Microsoft Office 发起挑战。该公司在 2024 年的《福布斯》AI 50 强榜单中脱颖而出,其流行程度的快速上升也得到了社交媒体上大量 Notion 教程的证实。

April 15, 2024

View Article

福布斯采访 Notion 创始人:用“乐高”式创新挑战 Google Docs 和 Microsoft Office [译]

Notion 是一款由人工智能驱动的生产力工具,正在向 Google Docs 和 Microsoft Office 发起挑战。该公司在 2024 年的《福布斯》AI 50 强榜单中脱颖而出,其流行程度的快速上升也得到了社交媒体上大量 Notion 教程的证实。

April 14, 2024

View Article

Ray Kurzweil 与 Geoff Hinton 关于未来 AI 发展的辩论 [译]

在 2024 年 Abundance360 峰会期间录制的这一集中,Ray、Geoffrey 和 Peter 展开了一场关于 AI 是否能具备自我意识、意识的本质是什么以及 AI 是否应有权利的辩论。美国发明家及未来学家 Ray Kurzweil 是人工智能 (artificial intelligence) 的先驱,他在光学字符识别 (OCR)、文本到语音、语音识别技术上作出了巨大的贡献。他撰写了多本关于 AI 与技术未来的书籍,获得了国家技术与创新奖章 (National Medal of Technology and Innovation) 等多项荣誉。在 Google,Kurzweil 致力于机器学习和语言处理技术,推动技术进步和人类潜能的提升。被誉为“深度学习之父”的 Geoffrey Hinton 是一位英国 - 加拿大的认知心理学家和计算机科学家,他在人工神经网络、深度学习 (deep learning) 和机器学习领域的开创性研究极大地推进了图像和语音识别等复杂任务的算法发展。推荐阅读 Ray 的最新作《奇点更近了:当我们与 AI 合并》。

April 13, 2024

View Article

如何设置 Mixtral-8x22B | 基础模型提示入门 [译]

Mixtral 8x22B 已经面市,这是首次推出一款可以商业使用的开源 GPT-4 类型模型。然而,它并非一个指令优化型模型,而是一个基础模型。这意味着我们需要用全新的方式来进行提示。虽然这更具挑战性,但并非无法实现。

April 13, 2024

View Article

价值 100 亿美元的 Notion 欲构建您的全能 AI 应用 [译]

Notion 的联合创始人 Ivan Zhao 凭借其优雅的生产力应用程序在硅谷投资者和广大用户中赢得了极大的关注,该应用一度火爆到服务器都承受不住了。现在,这家盈利的创业公司的 CEO 看到了一个突破机会,他计划抓住 AI 的先机并大胆进攻,挑战微软和谷歌在职场的主导地位。

April 13, 2024

View Article

访谈记录:Ezra Klein 采访 Dario Amodei [译]

Ezra Klein 每周二和周五会带来一场讨论重大议题的对话,例如今天他与 Dario Amodei 的对话。

April 13, 2024

View Article

揭穿号称首位人工智能软件工程师 Devin 能在 Upwork 接活的谎言![译]

近期,自称“首位 AI 软件工程师”的 Devin 被推出。公司不实地宣称他们的视频展示了 Devin 完成并从 Upwork 获得自由职业报酬的情况,然而视频实际上并未显示这些内容。

April 13, 2024

View Article

浅显易懂地介绍 llm.c [译]

当我们训练像 ChatGPT 这样的大语言模型时,需要处理大量的代码和复杂过程。

April 12, 2024

View Article