浅显易懂地介绍 llm.c [译]
当我们训练像 ChatGPT 这样的大语言模型时,需要处理大量的代码和复杂过程。
April 12, 2024
View Article当我们训练像 ChatGPT 这样的大语言模型时,需要处理大量的代码和复杂过程。
April 12, 2024
View Article今天,我想探讨一个我们在该领域讨论不足的问题:软件工程师的心理健康,尤其是那些承担领导职责的人。作为技术联合创始人,我亲身经历了焦虑的困扰。这种感受虽然常伴随我们的职业生涯,但并未列入工作职责之中。
April 12, 2024
View Article马斯克访谈 —— 尼古拉·坦根采访,谈 AI、特斯拉、中国电动汽车、Twitter(X)、SpaceX、中国电动汽车、企业文化与管理、火星殖民
April 11, 2024
View Article不管是编写代码、撰写文本、制作图像,还是其它应用,生成式 AI 对众多用户来说都如同一个充满神秘的黑盒。一般而言,用户只需简单地访问网站、安装应用或添加扩展,便可以直接体验到 AI 工具带来的便捷。但是,您是否好奇过这个黑盒背后的运作原理呢?本文旨在揭开我们的代码 AI 助手 Cody —— 它能深入理解您的整个代码库 —— 在代码 AI 生成过程中所涉及的奥秘。虽然使用大语言模型(LLM)来回应代码 AI 生成请求看似简单,但要在涵盖广泛用例、编程语言、工作流以及其他多变因素的生产环境中实现,确保既满足高质量完成的标准又能保证开发者的满意,却是一项极其复杂的挑战。本文将不仅探讨大语言模型的重要性,还将详述如何将其扩展为一个包含多个预处理和后处理步骤的全功能 AI 工程系统,讨论上下文的作用及其获取方法等多个方面,一起来深入了解代码 AI 生成的完整生命周期吧!
April 10, 2024
View Article在星际基地,埃隆·马斯克就公司将人类送往火星、开启多行星生命之旅的计划提供了最新进展。火星是开始实现人类多行星生存的最佳目的地。
April 8, 2024
View Article这是一段题为“Video generation will lead to AGI by simulating everything”的演讲稿,由 OpenAI 的 Tim Brooks 和 Bill Peebles
April 7, 2024
View ArticleJames Henry Clark 1944 年 3 月 23 日出生于德州平原城,他的家境并不富裕。父亲酗酒且无法长期维持工作,母亲则在当地一位医生的诊所工作,月入约 225 美元(折合 2024 年约 2605 美元)。Clark 幼年时父母就离异了,即便按照通胀调整后的标准,他母亲的工资似乎尚可,实际上她在扣除所得税和社保后仅得到 175.50 美元(约 2032 美元),这是她和三个孩子的唯一生活来源。Clark 本人则是个颇为叛逆的少年,高中时期的一些“壮举”包括在乐队巴士上点燃烟雾弹、偷带臭鼬进舞会、对英语老师大喊“去地狱”,酗酒及参与飙车比赛。考虑到那个年代,饮酒往往伴随着接连不断的吸烟。
April 7, 2024
View Article一种在媒体和私下里经常被重复的观点认为,对于利用人工智能(AI),现有的大公司而非新兴初创企业,显得更加得心应手。这种思维方式认为,AI 更多是一种强化现有企业地位的持续技术,而不是一种能够为新入场者赋能的颠覆性力量。这种看法在一定程度上是有道理的,尤其是对于那些致力于提升员工完成其*现有*工作效率的初创企业——不妨看看 Adobe 和 Notion,它们如何以闪电般的速度融入 AI 功能。传统观点认为,初创公司需要在大公司弄清楚如何创新之前解决分销问题。但对许多应用场景而言,现有公司的创新似乎只需一次 OpenAI API 的调用即可实现。然而,这样的论调过于简化了实际情况。我们现在见证了一批 B2B AI 公司,他们通过借鉴消费者世界中的经典策略——以更低的成本提供远超十倍的体验——而快速增长其收入。
April 7, 2024
View Article在这次访谈中,阿里巴巴联合创始人蔡崇信与主持人尼古拉畅聊了他的成长历程、职业发展以及个人见解。蔡崇信 13 岁从台湾移居美国,通过参与体育活动克服语言障碍,融入新环境。他的父亲虽然严厉,但对他产生了深远影响。加入阿里巴巴之前,蔡崇信在瑞典华伦贝格家族的投资公司工作,学习投资基础知识。1999 年,他应朋友之邀去杭州见马云,被马云的愿景和魅力所吸引,加入了阿里巴巴。公司早期的办公环境虽然简陋,但团队充满激情与凝聚力。阿里巴巴的发展历程中遇到过许多挑战,如 2005 年雅虎的投资、淘宝的盈利模式创新、竞争压力和组织架构调整等。新冠疫情和监管压力也对公司产生了影响。面对挑战,蔡崇信强调要勇于承认错误,及时调整战略。对于中国经济和消费者,蔡崇信指出,尽管房地产市场下滑和就业不确定性影响了消费者信心,但中国作为制造业强国,拥有巨大的潜力。在人工智能领域,阿里巴巴重视云计算和电商业务与 AI 的结合,但也面临美国芯片出口限制的影响。中美在 AI 领域存在差距,但中国正在努力赶上。在地缘政治方面,蔡崇信强调遵守法规、促进全球贸易的重要性,同时也意识到在美国开展业务面临数据隐私和网络安全方面的顾虑。他认为西方对中国存在一些误解,不应低估中国人民的能力和潜力。谈到企业文化和领导力时,蔡崇信分享了阿里巴巴"快乐工作,认真生活"的理念,强调领导者应给予即时反馈、保持谦逊,鼓励创新。在个人生活方面,蔡崇信购买 NBA 布鲁克林篮网队,看到了体育与商业的共通原则。他珍惜与家人共度的时光,阅读间谍小说是他的一大兴趣。最后,蔡崇信给年轻人的建议是,要发展专业技能,成为某一领域的专家;同时学习多项技能,如数据科学、心理学和编程。具备专业技能和多样化技能,是在现今世界取得成功的关键。
April 7, 2024
View ArticleTorvalds 认为 LLM 可以帮助程序员编写代码,发现明显的错误,但他并不认为这是一场革命性的变化。Torvalds 希望 LLM 能够帮助审查代码和维护子系统,因为它们擅长发现愚蠢但难以察觉的错误。Torvalds 认为 LLM 的价值远远超过 "增强版的自动纠错",它们可以成为帮助程序员更好地工作的工具。他对 LLM 的未来持乐观态度。
April 6, 2024
View Article尽管现如今最尖端的 AI 模型还存在不少缺点,但几十年后,人们定会将它们视作通用人工智能的开山之作。
April 5, 2024
View Article这是我们第十次发布关于数据、分析、机器学习和人工智能生态的年度综述。覆盖这个领域十多年来,现在的局势比以往任何时候都更加令人兴奋和充满前景。多年来我们跟踪的所有主流趋势和细分领域正汇聚在一起:大量数据已被数字化;通过现代化工具,我们可以快速且经济地存储、处理和分析这些数据;更重要的是,这些数据现在能够供给性能更强的 ML/AI 模型使用,这些模型能够理解数据、识别模式、基于数据进行预测,甚至现在能够创造文本、代码、图像、声音和视频。
April 5, 2024
View Article别再对着空白页束手无策了!这里有 15 个灵感满满的 ChatGPT 提示,助你寻找研究灵感、构建强有力的论据、撰写清晰简洁的文章,突破创作瓶颈,提升学术写作效率。
April 4, 2024
View ArticleClaude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。
April 3, 2024
View ArticleOpenAI 坚信,通过建立、广泛部署和应用 AI,我们可以改善人们的生活,并开辟一个更加美好的未来。这一进程依托于不断的创新与市场竞争的自由。在这些宽泛原则下,推动 AI 前景的路径多种多样。OpenAI 是最先尝试解决如何公平分配基础模型带来前所未有利益的 AI 开发者之一,我们通过分享这段历史背景,旨在为 NTIA 的评议提供参考。
April 3, 2024
View Article欢迎来到四月酷日!这是一个与愚人节相似但却截然不同的日子——我们不是制造尴尬笑话,而是创作与平时不一样的、真正有价值的内容。比如,去年我就分享了一篇关于互联网上最古怪市场的文章。而今年,我则是踏上了一条全新的探索之路。
April 3, 2024
View Article这周,我参加了斯坦福大学举办的大规模故事发现数据新闻学术会议。在这样的会议上,如何从 PDF 和图片中有效提取数据始终是一个热门议题。
April 3, 2024
View ArticleGoogle 的联合创始人拉里·佩奇和谢尔盖·布林,对恶作剧情有独钟,他们在创立公司不久后的每年愚人节,总是推出令人啼笑皆非的想法。例如,有一年 Google 发布了一则招聘启事,寻找月球上的哥白尼研究中心的研究员。另外一年,他们还宣布打算在搜索引擎中推出一项能“嗅觉搜索”的创新功能。这些搞笑的创意年复一年地上演,让人们逐渐将其视作 Google 惯有的恶作剧,笑对这些离奇的创意。正是基于这样的背景,佩奇和布林在 20 年前的愚人节,推出了一个让人难以置信的产品。那就是 Gmail,一种免费邮箱服务,每个账户提供 1GB 的巨大存储空间。
April 2, 2024
View ArticleGPT 是 Generative Pre-trained Transformer 的缩写。首个单词较为直接,它们是用来生成新文本的机器人。"Pre-trained" 指的是模型经历了从大量数据中学习的过程,这个词暗示了该模型还有进一步在特定任务中进行额外训练和微调的可能。然而,最后一个词,才是真正重要的部分。Transformer 是一种特定类型的神经网络,一个机器学习模型,它是现今 AI 高速发展的核心创新。我希望通过这个视频和接下来的章节,以一种便于理解的方式,阐述 Transformer 内部实际发生的过程。我们将逐步探索流经它的数据。
April 2, 2024
View Article深入浅出地解释 Transformer 和大语言模型 (LLMs) 中心机制——注意力机制(Attention)。
April 2, 2024
View ArticleNvidia 和 Microsoft 只是冰山一角
April 1, 2024
View Article自高中起,我便开始编程。我还隐约记得,曾与一位朋友共同利用 TortoiseSVN 分享代码,开发了一款安卓游戏。大学期间,我学会了从 GitHub 克隆仓库以获取计算机科学作业。之后,在实习期间,我开始使用 GitHub 审核和合并合并请求(PR)。像我这样在过去十年内步入职业生涯的大多数开发者,可能都有着类似的经历——不论是参与开源项目还是公司私有团队,GitHub 都成了源代码和代码更改的代名词。
April 1, 2024
View Article他们因缘际会,对一项创意产生了浓厚的兴趣,并共同撰写了“Transformers”论文——这是近代史上最具里程碑意义的技术革新。
April 1, 2024
View Article我们将分享一次 Voice Engine 小型试验项目的经验教训,这是一款能够创建定制语音的模型。
March 29, 2024
View Article我期待与大家分享我在 AI 智能体方面的发现,我认为这是一个令人兴奋的趋势,所有涉及 AI 开发的人都应该关注。同时,我也对所有即将介绍的"未来趋势"充满期待。
March 28, 2024
View Article这是一段能帮你给代码生成单元测试的提示词,针对 Claude 3,但理论上来说可以适用于绝大部分模型。
March 28, 2024
View Article随着企业引进人工智能(AI)以提升工作效率,一个不适感的矛盾出现了:员工往往需要培训那些未来可能会取代他们的系统。AI 伦理倡导者 Madison Mohns 分享了三个领导原则,旨在既拥抱技术进步,又重视同事的福祉——为构建一个人工智能能够增强人类潜力的未来而铺路。
March 26, 2024
View Article在这篇博客文章中,我们将深入剖析 Sora 模型背后的一些技术细节。我们还将探讨我们对这些视频模型可能产生的影响的看法。最后,我们将讨论我们对于用于训练 Sora 等模型所需计算资源的想法,并预测了训练计算与推理相比的情况,这对于预估未来 GPU 需求具有实质的参考价值。
March 25, 2024
View Article我们从创意界得到了极具价值的反馈,这对我们模型的完善大有裨益。
March 25, 2024
View ArticleJim Fan 在 NVIDIA GTC 2024 上的演讲:《在开放世界中的通用智能体》
March 24, 2024
View Article如果说去年的 GTC 炉边谈话,黄仁勋与 OpenAI 首席科学家 Illya 进行的是一场对技术未来的漫谈,那今年这场炉边谈话就是李飞飞对人类未来的呼吁。
March 23, 2024
View Article这段 Perplexity 的创始人 Aravind Srinivas 与 Stripe 的 David Singleton 炉边谈话的视频非常值得一看,Perplexity 很坦诚的分享了 Perplexity 的创业历程、内部运作、招人、从其他大公司学到的经验以及未来展望等话题。
March 23, 2024
View Article我对低代码持怀疑态度。
March 22, 2024
View Article同样也是基于三步翻译法,但是这次是更加通用。
March 22, 2024
View Article目前,开发者们正经历双重的心理压力。一方面,持续不断的裁员让整个行业在较短时间内失去了更多的岗位,这种情况自二十多年前的互联网泡沫以来前所未有。那些曾经门庭若市的资深开发者现在却连一个回应都难以获得。而随着 Devin 的推出,AI 带来的威胁突然显得更加紧迫。
March 21, 2024
View ArticlePrompt Engineering 的核心就是你怎么将一个复杂的任务拆成科学合理的步骤,并且让前面每一步的结果都成为后面步骤的基础,所有步骤合并在一起得到最终的结果,而不要指望一步得到结果。
March 20, 2024
View Article以 Lex 采访 Sam 的视频文稿的后面 45 分钟,分别让 GPT-4 和 Claude 3 总结,GPT-4 的要点总结的更好,生成结果更完整。
March 20, 2024
View Article本文是 Lex Fridman 播客的一期节选,主题是 OpenAI 的 CEO Sam Altman 与 Lex 的对话。Sam Altman 是 OpenAI 的 CEO,该公司是 GPT-4 的背后推手,ChatGPT, Sora, 也许有一天,会成为建立通用人工智能的那家公司。这是 Lex Friedman 播客。
March 19, 2024
View Article我家孩子沉迷搭乐高,陪他搭乐高的时候,我就联想起 AI 写程序!
March 18, 2024
View Article当大语言模型 (LLMs) 能够创作出图像、文本和代码时,它们在创意领域引发了极大的关注。起初,这些创作令人啼笑皆非,比如画出手部奇怪的人物、产生错误的事实和代码的幻觉。然而,随着时间的推移,情况正在逐步且稳定地改善。在这些模型诞生之前,人们常常反对将这些任务自动化,认为机器无法进行创造性思维。但现在,这一论点正变得越来越站不住脚。那么,我们的下一步该往哪里走?
March 18, 2024
View Article在这次独家采访中,我们有幸与微软 CEO Satya Nadella 进行对话。微软,作为全球市值最高的公司,其领导者的思维方式和对未来的见解无疑对我们所有人都有着重要的启示。Nadella 在采访中分享了他对科技行业未来、AI 的角色、以及个人成长和领导力的深刻见解。以下是这次富有启发性对话的整理稿。
March 17, 2024
View Article本指南特别适合初步了解初创企业领域的朋友们。对于那些已经阅读过 YC 合伙人大量著作的人来说,这里的内容可能并不陌生——我们的目标是把它们汇聚于此。
March 14, 2024
View Article目前,开发者们正经历双重的心理压力。一方面,持续不断的裁员让整个行业在较短时间内失去了更多的岗位,这种情况自二十多年前的互联网泡沫以来前所未有。那些曾经门庭若市的资深开发者现在却连一个回应都难以获得。而随着 Devin 的推出,AI 带来的威胁突然显得更加紧迫。
March 13, 2024
View Article昨天 Devin 的大火,像一个 AI 程序员,能独立完成一些编程任务。这又引发了很多程序员是不是要被 AI 替代的讨论和焦虑。以至于很多人都在说:既然 AI 写代码能力越来越强了,还要不要学习 CS?要不要改行?
March 13, 2024
View ArticleWhisper 项目已经让我们看到了一个不远的未来:快速、免费并且几乎没有错误的翻译和转录技术无处不在。这一进步激励了许多开发者在保证最大性能的同时,以最少的阻力改进并部署这一技术。
March 12, 2024
View ArticleClaude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。
March 11, 2024
View Article我去年编写了一个程序,名字叫做 bors,现在来聊聊它以及它的一些前身的故事。这篇技术分享可能会让大多数人觉得乏味至极,但如果你的饭碗是靠编程挣的,那么我建议你不妨花一点时间看看。
March 9, 2024
View Article许多作家借助 ChatGPT 或其它 AI 聊天机器人来调整和优化他们的文风。然而,AI 在传递微妙的情感上仍显笨拙**。一些 AI 用户已经分享了几个小技巧,这些技巧可以帮助产生更优质的文本,并解决 AI 面临的问题。** 但实际效果如何呢?我进行的研究表明,利用已有的文本并请求多种回复,可以让输出更加自然。而使用特定的语气词则效果不明显。
March 9, 2024
View Article软件行业正在重新领悟一个老教训:复杂性是致命的
March 8, 2024
View Article如果 OpenAI 想要通过牺牲人类免受恶意 AI 的安全,以获得更好的防止人们试图控制 AI 的安全,那么他们需要提出比我迄今为止看到的任何东西都更有力的理由,以证明后者的风险有多么严重。
March 7, 2024
View Article