通过在粘贴的文本中加入不可见指令,实现对大语言模型的提示注入 [译]
我重新审视了我此前的推文,关于这是近几周来最重要的提示注入发现。事实上,这是自提示注入出现以来最大的技术突破和安全挑战。
January 11, 2024
View Article我重新审视了我此前的推文,关于这是近几周来最重要的提示注入发现。事实上,这是自提示注入出现以来最大的技术突破和安全挑战。
January 11, 2024
View Article2021 年末,我们这个遍布全球的五人工程师团队,签署了关闭我们初创公司 Gradio 的文件。对大多数创始人而言,这通常是一个伴随着悲伤或深刻反思的时刻。但我们却在庆祝。因为我们即将被 Hugging Face 收购!这次收购是我们辛勤努力的成果,但在几周时间里,一直被一位投资者所阻挠。我们对他施加的压力越大,他就越坚决不签署收购协议。然而出乎意料的是,这位投资者最终让步,使我们得以加入 Hugging Face。这是自从被收购以来,我首次详细记录这段经历。我希望这能够揭开初创企业被收购的神秘面纱,同时也展示创始人们为了提高成功被收购的几率可以做出哪些决策。
January 11, 2024
View Article在这个教程中,我们将探讨文本分割的五个层次。这份非官方的列表是为了增添趣味和教育目的而编制的。是否曾尝试向 ChatGPT 输入长篇文本,却被告知内容过长?或者你在尝试改善应用程序的长期记忆能力,但似乎效果仍不理想。要提升语言模型应用的性能,一个非常有效的策略是将大型数据切分为小块。这个过程被称为分割或分块(这两个术语我们将交替使用)。在多模态领域中,这种分割同样适用于图像。我们将介绍很多内容,但如果你能坚持阅读到最后,我保证你将对分块理论、策略以及进一步学习的资源有一个全面的了解。
January 11, 2024
View Article做决策其实并不复杂。在大多数情况下,我们心里已经有答案。然后我们却花费几周时间来自我说服,认为这是最佳的选择。有时,我们甚至永远无法下定决心。我们为何如此自我折磨?1. 首先,是因为我们总认为做重要决策应该很困难。我们甚至可能希望它困难。因为如果我们花很长时间而不是短暂考虑后做出决策,最后却失败了,我们可以找到合理的借口 —— “但我已尽全力!”2. 其次,我们总是尽力寻找最佳方案。因为我们面临的风险非常大。这直接导致了一种被称为“分析瘫痪”的怪圈,我们在其中陷入漫长的迷茫。
January 11, 2024
View Article“计划谬误”是指我们在预测个人生产力时的自然偏差:我们倾向于着眼于最佳情景,或者非常接近的情况,但这种情况很少实现。
January 11, 2024
View Article本研究旨在探究 OpenAI 的 ChatGPT 模型在编程任务中的有效性和效率,该模型基于 GPT-3.5 和 GPT-4 技术。研究目的是了解 ChatGPT 对编程和软件开发的潜在影响。我们采用定量方法,使用 Mostly Basic Python Problems (MBPP) 数据集来衡量这些模型的表现。研究不仅对 GPT-3.5 和 GPT-4 进行了直接评估,还包括了与 AI 领域其他知名大语言模型的比较,特别是 Google 的 Bard 和 Anthropic 的 Claude,以此衡量和比较它们在同样任务上的熟练程度。研究结果凸显了 ChatGPT 模型在编程任务上的优势,为 AI 社区,特别是开发者和研究人员提供了有价值的洞见。随着人工智能技术的广泛应用,本研究为 AI 辅助编程的发展提供了一份及时的参考。
January 11, 2024
View Article我登录了 StickK.com,一个创建承诺合约的平台,并在那里立下了一个挑战:我计划在未来 9 个月里完成一部小说,并在年底前交给我的文学代理人审阅。我不仅与我的朋友们分享了这一承诺,还在包括 10 万播客听众在内的多个公共场合公开讨论了这一计划。这个挑战的风险有多大?如果我没能完成,我就要向一个我并不支持的所谓“反慈善”组织捐赠 9999 美元,这是 StickK 平台允许的最高金额。剧透一下:我最终成功了,在年底前的最后一小时,我几乎耗尽了所有精力。在完成初稿之后,我甚至抽出一天时间,利用 AI 制作了一部小说预告片。但重要的是,尽管我对这个挑战充满信心,当我签订这个合约时,却根本无法确定能否成功:近 10 年来,我几乎未曾涉足小说创作。虽然我写作能力不错,但历来写作速度不快。我还需要管理一家需要大量时间和精力的公司。那么,我是怎样坚信自己能够完成这个挑战的呢?
January 10, 2024
View Article我并不认为自己有资格给出建议。但许多人在 Twitter 上私信我,询问我的想法,所以我写下了这些话。这样,我就不需要反复回答相同的问题了。编辑这篇文章的过程中,我发现我实际上是在为我年轻的妹妹 Katherine 分享我的经验。
January 10, 2024
View ArticleElon Musk 是一个充满争议的人物。我的目的,如同往常,是为了在喧嚣、复杂或难以理解的话题中增添一些细致见解和清晰信号。不论你对 Elon 怎样看,我认为推动讨论走向更深入、更有意义的交流是非常有价值的,同时希望这不会给我带来太多风险。问题在于,市面上 99% 的批评都出于恶意且不准确,导致大多数人缺乏理解 Elon 行动动机和目的的必要背景。这是个问题,因为 Elon 是一位颇具影响力和远见的领导者,他的公司在传递变革性技术的过程中扮演着越来越重要的角色。
January 9, 2024
View Article近日,我接受了 NPR 的 Planet Money (播客,文字记录) 的采访,讨论信用卡诈骗的一个特别形式。有个观点未能播出,那就是:“理想情况下,诈骗的存在不应为零。”这个说法听起来可能有些违反直觉,甚至显得有些矫情。但实际上,这是一个值得信赖的观点。
January 9, 2024
View Article许多商业书籍强调培育心理韧性来应对困境,却忽视了更重要的因素。韧性已成为一门盛行的生意。机场书店充斥着各种关于“为何有人能成功而他人却失败”的书籍,或承诺教你培养“无敌的心理韧性”。TED 演讲、播客和社交媒体上充满了介绍韧性人士的三至五个特点,如乐观、坚韧和成长心态。随着管理界认识到成功背后往往隐藏着无数次的失败,关于如何从失败中恢复的建议也应运而生,这些建议通常源自精英军事部队或极限运动员的经验。作为管理思维领域近 20 年的从业者,我编辑和采访过许多这样的影响者。然而,这些良好意图的建议者却给人留下了两个误解:首先,认为韧性很罕见;其次,认为韧性几乎完全来自内心。事实上,这两点都不正确。
January 9, 2024
View Article这是我在 2023 年 11 月 10 日,也就是 Go 作为开源项目发布 14 周年之际,在悉尼 GopherConAU 会议上所做的闭幕演讲。演讲中穿插使用了一些演示文稿的幻灯片。
January 9, 2024
View Article我经常听人说,应该依据第一直觉来做决策。但在我们这个行业,这种做法未必总是最佳选择。工程决策绝不能仅仅基于直觉,因为这太主观了。我们必须依赖事实,客观地做出判断。让我们深入探讨一下。
January 8, 2024
View Article人工智能(AI)预计将彻底改变我们的工作方式,为首批采用者带来显著的竞争优势。许多公司已经开始使用 AI 驱动的自动聊天机器人来处理客户咨询,但仍有些公司对这种新兴技术不够熟悉。这里面的关键问题是:这些应用中的 AI 效果如何?目前,像 ChatGPT 或 Google 这样的开放式大型语言模型(LLM)面临的一个挑战是对实时数据的访问受限。虽然有像 Bing 插件这样的例外,但即便如此,直接从自己网站上提取数据也不容易。不通过昂贵的模型微调就克服这个限制是个大挑战。而检索增强生成(Retrieval-Augmented Generation,RAG)技术或许能提供解决方案。
January 8, 2024
View Article虽然构建成功的软件架构的过程看似简单,实际上却颇具挑战。要理解 QARs,并在此基础上做出最优权衡,需要深刻的洞察力和丰富的经验,而这些往往需要通过对架构本身的不断试验和调整来积累。虽然过程本质上不复杂,但所涉及的权衡决策通常充满挑战,而且难以找到简单的解决方案。
January 8, 2024
View ArticleViberary 是我创立的一个副项目,旨在通过氛围来查找书籍。我创建这个项目,一方面是为了满足自己进行机器学习侧项目的兴趣,另一方面是为了探索当前搜索和推荐技术的界限。这个项目不仅是对我最近在嵌入技术方面深入研究的一个补充,而且是一个符合生产级标准的实践。虽然这个项目很有趣,但它也确切地证实了我一直以来对自己的理解:达到 MLE(机器学习启蒙)是一个循环过程,涉及建模、工程和 UI 设计等多个方面,并将这些方面紧密结合在一起 - 将系统投入生产就是最终的奖赏。和任何生产级系统一样,机器学习并非魔法,即使数据输出不是确定性的,构建这类系统也需要精心的工程和设计选择。我认为,这是当前机器学习领域中常被忽视的一个方面。通过这篇文章,我不仅想要回顾我所做的工作,还想概述一下搭建一个基于 Transformer 的机器学习应用所需的一切,哪怕是一个小型的、使用预训练模型的应用,我希望这篇文章能成为一个有用的资源和参考。Viberary 的机器学习架构是一个基于双塔模型的语义检索系统。它使用 Sentence Transformers 预训练的不对称 MSMarco 模型对用户的搜索查询和 Goodreads 书籍数据库进行编码。
January 8, 2024
View ArticleLlamaIndex 的数据摄入管道是一种全新且改进的方法,用于高效摄入和管理数据文档。这一管道特别适用于需要将输入文档经过一系列处理步骤(如切分、嵌入等)后才进行索引建立的情况,比如我们的 RAG 管道就是这样。此外,它还具备缓存、文档存储管理、向量存储更新等实用功能。
January 8, 2024
View Article如果你的职业生涯进展顺利,对生活感到满意,人际关系也很和谐,那么你可以不用阅读这篇文章。请享受你美好的一天,朋友,这篇文章可能不适合你。你做得很出色,我们都为你感到骄傲。为了不让你觉得白费了一次点击,这里有一张 Lenny Kravitz 戴着超大围巾的照片。
January 8, 2024
View Article就在昨晚我宣布将对所有现任 MIT 教员进行剽窃审查之后不久,我确信 Kornbluth 校长、MIT 行政团队和董事会成员们能听到校园内集体传来的哀叹声。为什么这样?原因很简单:每位教员都清楚,一旦他们的研究成果被 AI 盯上,学术界的任何文献都难以逃过 AI 的发言,检测引号缺失、改写不当或未能适当引用他人工作等问题将无所遁形。但昨晚不仅是 MIT 的教员失眠,哈佛大学的教员们、其董事会成员和行政领导也同样辗转反侧。因为,我们为什么要止步于 MIT?难道我们不应该同样深入调查哈佛大学的学术诚信吗?耶鲁、普林斯顿、斯坦福、宾夕法尼亚、达特茅斯怎么办?意思你的明白?
January 7, 2024
View Article长久以来,人们一直在探讨大语言模型 (LLMs) 在何种程度上可能会“记住”其训练数据的问题。包括 Google DeepMind 的 Nicholas Carlini 和本文的第一作者 Gary Marcus 在内的学者都曾对此提出疑问。最新的实证研究显示,在某些情况下,LLMs 能够原样复制或稍作修改后复制其训练集中的大量文本。例如,Milad Nasr 及其团队在 2023 年的论文 中指出,LLMs 可以被激发,泄露如电邮地址和电话号码等私人信息。Carlini 和他的合作伙伴 最近的研究 也显示,较大的聊天机器人模型(而非小型模型)有时会逐字复制其训练集中的大量文本。
January 7, 2024
View Article研究显示,单靠意志力戒掉坏习惯是徒劳无功的。我们需要找到不必依赖坚强意志的策略。
January 7, 2024
View Article今年,人工智能在招聘偏见、包容性、监管等多个领域的影响将更加显著。就像 2023 年成为人工智能的转折点一样,2024 年人工智能预计将产生更深远的影响。这一次,工作者们已做好准备迎接挑战。随着生成式 AI (Generative AI) 已经成为员工关注的焦点超过一年,他们不仅更加理解其在当今工作环境中的作用,而且也准备好拥抱随之而来的变化和机遇。现在是利用这一优势的时候了。为了保持领先,工作者们需要了解即将出现的 AI 领域的这五大趋势。
January 7, 2024
View Article程序员对提升生产力的方法论兴趣浓厚 —— 如何更准确地估计任务、用更少的时间完成更多工作,以及提高工作质量。我也深入研究了这一领域。在阅读了大量书籍后,我发现了一些可能对其他软件开发者有用的有趣见解。
January 6, 2024
View Article在机器学习 (ML) 的众多近期进展中,有两个特别吸引我的。第一个是 gpt-3.5-turbo-instruct 在国际象棋中达到 1800 ELO 水平。一个大语言模型 (LLM) 能够仅凭网络上随机抓取的文本就学会下好棋,这似乎不可思议。第二个是 Kenneth Li 的论文《生成世界表示》。The Gradient 上有一篇精彩的摘要,以及 Neel Nanda 的后续分析。他们训练了一个含有 2500 万参数的 GPT,用于预测奥赛罗游戏中的下一步棋。它不仅能在训练数据集未覆盖的游戏中准确落子,而且通过线性和非线性的探测发现,这个模型能准确追踪棋盘的状态。然而,这一成果仅限于使用奥赛罗游戏树上均匀采样得到的合成数据集训练的模型。当他们尝试将相同的技术应用于使用人类对弈数据训练的模型时,结果并不理想。在我看来,这是该论文发现的一个重要限制,可能会影响其在现实世界的应用性。比如,我们无法仅通过从代码树均匀采样来生成代码。因此,我对此进行了深入研究。我训练了一些国际象棋游戏模型,并对这些训练好的模型进行了线性探测。我的研究结果非常正面,解答了我之前的所有疑问(当然,这也带来了更多新的问题)。
January 6, 2024
View Article这不是大家现在热议的那本 Musk 新传记,而是 Ashlee Vance 在 2015 年写的 Musk 传记。我在 7 月份开始阅读它,那时还不知道有新出的一本。不过没关系:Musk 一如既往,始终如一。我阅读这本书,是想弄明白他究竟是个什么样的人。Musk 就是一个谜团。他引领着世界上最先进的火箭的制造,显示出他的聪明才智。作为世界上最富有的人,他显然拥有出色的商业决策能力。然而,这位聪明、商业决策出众的人物,却不时做出看似愚蠢的商业举动。他无谓地与监管机构争执,提起注定失败的无效诉讼,虐待关键员工,甚至给全球知名的品牌重新命名。
January 6, 2024
View Article一座庞大的图书馆就像是一个奇妙的伪无限世界,覆盖了成百上千的主题,汇集了无数作者的声音。好的图书馆能够在有限的空间里营造出一种感觉:即便你花费几个世纪去阅读,也无法完全掌握其内部蕴含的知识。这不仅是因为书籍众多,更因为当你通过一本书的视角去解读其他书籍时,总有新的学问等着你去发掘。这就像是用有限的积木搭建起无限的宇宙。
January 6, 2024
View Article作为 Kapwing 的全职软件工程师,同时也是一位不断在世界各地漫游的数字游民,我领悟到了许多如何拥抱这种生活方式的诀窍。记得几年前的一个工作日午后,我家的门突然响了。来人是 Bill,我们农场的一名员工。“你猜怎么着,一头我们都没注意到怀孕了的牛突然生了小牛,”他兴奋地告诉我,“我们准备用你的名字给小牛命名。”对于一个牧场主来说,这或许是平常不过的一天。但我,其实并非牧场主。我是一名全职软件工程师,同时自 2020 年起,我还踏上了数字游民的生活旅程。
January 6, 2024
View Article一年前,我暂停了编程生涯,开始尝试写小说,曾以为这是与编程截然不同的新旅程。然而,经过无数次的写作和反复修改,我现在深信两者其实有着诸多相似之处:无论是开发大型系统还是撰写小说,它们都有许多共通之处和类似的过程。这两种活动最明显的相似之处在于,不管是编程还是写作,你都在创作文字。尽管代码不同于自然语言写就的散文,它同样遵循着一套固定的规则(即语法),某些代码形式对大多数程序员来说颇为自然,而其他的即便形式正确,也可能难以理解。然而,编程和写作之间有更深层的联系:一个出色的程序和一本精彩的小说都是由各自的局部元素和整体构成精心编织而成。优秀的代码不仅要求每一条语句都写得清晰易懂,而且整个程序的不同部分需要保持独立性,设计上协调一致,互动清晰。同样,一本好的小说在字句的精准与整体结构和章节间的关系上也同样重要。
January 6, 2024
View ArticleReact 服务组件 为 React 引入了专属于服务端的强大功能。我在 Next.js 13 和 14 的应用中实践了这一新范式,接下来是我对其的真实评价。之前我一直在犹豫是否要发表这篇文章,因为 React 社区过去对待批评的态度让我有所顾虑。但最近,我认为分享我的看法变得尤为重要,特别是在我发现大多数现有批评要么记录不充分,要么基于对此技术的不熟悉。写下这篇文章,我是站在一个非常重视用户体验的角度。虽然我也关注开发者的体验,但我始终认为用户体验是最重要的。
January 6, 2024
View Article这些力量让大型公司变得反应迟缓且难以操作,但如果能妥善利用,它们同样可以发挥巨大效果。
January 5, 2024
View Article随着感恩节创下的 56 亿美元在线销售记录预示着电商的新纪元,也凸显了企业亟需采纳如人工智能这样的先进技术。
January 5, 2024
View Article我刚读了一篇名为“科学代码的低质量”的文章,作者认为科学家编写的代码质量不如涉及到“软件工程师”的情况。在过去的十多年里,我一直在一个以数学或物理背景人士为主的环境中工作,这里的人对“软件工程”的了解相对有限。
January 5, 2024
View Article“你的技术水平已经很不错了,但你还需要在沟通方面加强。” - 你的经理。对于软件工程师来说,这可能是最难以接受的反馈之一。为什么呢?因为你可能认为作为软件工程师,只需要擅长编程语言就足够了。但事实并非如此。单纯专注于编程可能会限制你的成长和晋升空间。
January 5, 2024
View Article这是一份全面的 RAG 指南,详细阐述了采用 RAG 的动机,以及如何超越基础或初级 RAG 构建的技术和策略。
January 5, 2024
View Article在许多关于大语言模型是否构成“人工智能”或“通用人工智能”(AGI)的讨论背后,潜藏着一些关于这些系统与人类大脑相似或不相似程度的假设。支持者倾向于认为,从计算规模和复杂性上来看,这些模型与大脑作为信息处理系统的关键特性相匹配。而怀疑者则常将大语言模型(LLM)视为“高级自动纠错工具”,并否认这些系统在类似大脑方面(或能展现出“智能”,不论定义如何)有任何实质意义。实际的答案可能介于两者之间。
January 5, 2024
View Article在机器人技术领域,通过模仿人类的动作来训练机器人(模仿学习)已经取得了显著的成果。然而,这些成果大多集中在桌面操作上,而缺乏在更广泛实用任务中所需的移动性和灵活性。在本研究中,我们开发了一个模仿复杂移动操作任务的系统,这些任务需要双手操作和全身协调。首先,我们推出了 Mobile ALOHA,这是一个用于数据收集的低成本、全身远程操作系统。它在原有 ALOHA 系统的基础上增加了移动底座和全身操作界面。利用 Mobile ALOHA 收集的数据,我们进行了监督式学习(即模仿并复制行为),发现将其与现有静态 ALOHA 数据集结合训练可以显著提高处理移动操作任务的能力。例如,通过对每项任务进行 50 次模仿演示,结合训练可以使任务完成的成功率高达 90%,让 Mobile ALOHA 能够自主完成一系列复杂的移动操作任务。这些任务包括煎炒虾并将其盛盘,打开双门壁橱存放重型厨具,呼叫并进入电梯,以及用厨房水龙头轻轻清洗使用过的平底锅。
January 5, 2024
View Article当我们回顾过去一年,我们的视角转向 2024 年开发者生产力的发展趋势,这包括平台工程的创新、AI 的辅助作用以及对这些因素的量化评估。
January 5, 2024
View Article作为 Kapwing 的全职软件工程师,同时也是一位不断在世界各地漫游的数字游民,我领悟到了许多如何拥抱这种生活方式的诀窍。记得几年前的一个工作日午后,我家的门突然响了。来人是 Bill,我们农场的一名员工。“你猜怎么着,一头我们都没注意到怀孕了的牛突然生了小牛,”他兴奋地告诉我,“我们准备用你的名字给小牛命名。”对于一个牧场主来说,这或许是平常不过的一天。但我,其实并非牧场主。我是一名全职软件工程师,同时自 2020 年起,我还踏上了数字游民的生活旅程。
January 5, 2024
View Article计算机历史中充满了各种对立,但 Apple 公司的历史尤为显著。创意与技术思维之间永无止境的碰撞孕育了许多令人难以置信的产品,这个故事正是源于对形式美与实用性的不同偏好之争。此故事的主人公非常杰出:我们说的是 Apple Macintosh 的两大创始人,乔布斯和 Jef Raskin。故事发生在 1979 年:就在几年前 Apple II 发布。那是 Apple 公司历史上的辉煌时刻,乔布斯身边聚集了一群杰出的头脑,现代计算机学的大幕正在拉开。
January 5, 2024
View Article自从几年前我在 Slashdot 发布了这篇文章,这个页面成了一个互联网的讨论热点,话题涵盖了从“你心目中的理想极客海报是什么?”到杰夫·拉斯金和史蒂夫·乔布斯这两位苹果麦金塔之父之间复杂关系的探讨。这个项目吸引人的地方在于,它不仅是史蒂夫·乔布斯和杰夫·拉斯金这两位杰出人物合作的实际成果……而且还反映了他们观点的不同。除了麦金塔电脑,如今能看到的这类成果寥寥无几。对于已故的杰夫·拉斯金亲自参与编辑、明确内容并与我共同创作这篇文章,我深感荣幸。
January 5, 2024
View Article在今天的新闻背景下,我想退一步,从更广阔的视角来探讨这个话题的真正含义。我最初对哈佛大学感到关切是在 10 月 8 日清晨,那时以色列尚未在加沙采取任何军事行动,却有 34 个哈佛学生组织公开支持哈马斯(Hamas),一个被全球认定的恐怖组织。他们单方面指责以色列对哈马斯的残暴行径负有全部责任。我不禁思考,这是怎么回事?
January 4, 2024
View Article过去的我记录下的内容,为未来的我带来了好处。现在的我也需要继续这种良好的习惯。在我作为软件开发人员加入最近的一个 Ruby on Rails 项目后,我想在着手更有挑战性的工作前,快速实现一些容易达成的小成就。因此,我决定对客户的网页应用程序进行一次“技术检查”。我之前在其他 Rails 项目上也做过类似的工作,但那已经是许多年前的事了。我甚至几乎记不起上周我编写的代码内容,更别提那时制定的一系列检查步骤了。幸运的是,过去的我曾有远见地在前雇主的博客上发表了一篇文章:Profile Your Future App,详细记录了当时的思考步骤。尽管这篇文章的部分内容已随时间略显过时,特别是一些提及的外部服务(考虑到科技的不断变化,这并不令人意外),但我依然能够利用文章中的大部分内容来提高我目前工作的应用程序质量,而无需重复发明已有的轮子(也许其他网页开发人员也能从中受益)。所以,谢谢过去的我,你做得很好!你在解决问题的过程中进行了记录,这些记录为未来带来了益处:一个有价值、可复制的过程,任何人都可以为自己做到。
January 4, 2024
View Article经常有朋友问我字幕文件格式是什么?以及我是如何生成字幕视频的?
January 4, 2024
View Article在大语言模型和生成式 AI 盛行的时代,技能为何仍至关重要。我的一个朋友对学习 Python 编程语言犹豫不决,他问道:“几年后 ChatGPT 不是可以直接帮你编写程序吗?”。这种想法暗示着 AI 将会取代软件工程师,从而让技术技能变得无关紧要。还有人担心新兴的 AI 模型可能会破解现在广泛使用的加密技术。相比工程师们,作家和演员等创意行业的人士似乎更加忧虑。本文旨在消除这些误解,降低对这些新技术的过度炒作,并在讨论中引入理性思考。它是为那些在过去的技术浪潮中游刃有余,且日常工作中极度依赖其不可替代的人类特质的专业人士所写。AI 已经成为公众焦点。投资如潮水般涌入,新产品层出不穷。我们正处于一个技术炒作的高峰期。尽管有人担忧失业或世界末日,我将阐明为何 AI 不会威胁你的工作,并解释为什么你应该积极利用这些工具。
January 4, 2024
View Article深入浅出地探索 Transformer 背后的数学原理,了解其工作原理。在本篇博客文章中,我们将详细展示一个 Transformer 模型在数学上的端对端(end-to-end)实例。我们的目标是彻底理解模型是如何运作的。为了让这个过程更加易于操作,我们将对模型进行大量简化。考虑到我们需要亲手进行不少数学计算,我们会减少模型的维度。比如说,我们不会使用 512 维的嵌入(embeddings),而是选用 4 维的嵌入。这样做可以让数学部分更容易理解!我们会使用随机生成的向量和矩阵,但你也可以用自己的数值来跟随实例。
January 4, 2024
View Article基本 GPT 能够浏览互联网、使用 Python 代码执行复杂计算、创建图像,以及利用内置大语言模型(LLM)知识处理用户指令。带有知识的 GPT 是一个附加了自定义文件的基础 GPT。带有动作的 GPT 是在基础 GPT 上增加调用 API(别人的服务器)的功能。带有动作和后端的 GPT 指的是您构建了一个基础设施(后端),并将您的 GPT 作为用户接入点连接上去。知识主要储存在后端,而不是在 GPT 上。
January 4, 2024
View ArticleChatGPT 中的 GPT Builder 是用来做什么的,我们为什么要开发它?以及它的 Prompt 是什么?
January 4, 2024
View ArticleGoogle DeepMind 机器人团队推出 AutoRT、SARA-RT 和 RT-Trajectory,旨在提升机器人在真实世界环境中的数据采集效率、动作速度和应用泛化能力。设想一个未来,你只需向你的个人助理机器人发出一个简单的指令——比如“整理房间”或“为我们准备一顿美味健康的饭菜”——它就能轻松完成这些任务。对于人类而言易如反掌的这些活动,对机器人来说则需要深刻理解周围世界。今天,我们公布了一系列重大的机器人研究进展,这些进展使我们距离这一美好未来更近一步。AutoRT、SARA-RT 和 RT-Trajectory 基于我们在 Robotics Transformers 领域的历史性成就,能够帮助机器人更迅速地做出决策,更准确地理解并导航其所处的环境。
January 4, 2024
View Article软件工程师的薪酬来源可以分为三大类预算。这些预算不仅决定了你日常的工作性质,还会影响你的职业发展路径。我认为,这就像是一条商业界的自然法则。这种模式的形成并不需要任何人有意识地去选择。
January 4, 2024
View Article刚成为软件工程师时,招聘人员总会向我介绍所谓的绿地项目,我在面试中经常遇到很多和编程语言相关的测试,数学也是我大学课程的重要部分,而“无估算”运动也在业界引起了一些关注。在软件工程师的职业生涯中,随着经验的积累,你会逐渐领悟到四个重要的真理,这些可能是你之前从未被告知的,或者与你初入行时的经验截然相反。
January 4, 2024
View Article