AI 历史的未来

作者：Substack

从 Chrome 早期的网页历史设计探索中，今天的 AI 产品能学到什么？

我们现在对 AI 聊天历史的思考，可能“想太多了”—— 就像当年 Chrome 对待网页历史那样。

故事要从近 20 年前说起。当时，谷歌的 Chrome 团队做了一件大事：他们为用户访问过的每一个网页都建立了完整的索引。这一下就创造出了一个极其丰富的数据集。设计师们兴奋地畅想：只要配上合适的界面，用户就能重新发现互联网，洞察自我，甚至将自己的数字足迹可视化。

但结果呢？历史功能的最佳用户界面（UI）原来是极其简单的。

网页历史的设计之路

2008 年那会儿，虽然所有浏览器都有“历史记录”功能，但几乎没人用。Chrome 团队相信它潜力无限——它应该是一个个性化的数据集，帮人们找回看过的内容，甚至理解自己的浏览模式。

设计师们热情高涨，一头扎了进去，勾画出各种天马行空的界面方案：有的像个性化的地铁路线图，有的像数据摘要，还有的做成了 Google 阅读器那样的信息流。

不久前，我和 Chrome 的第一位设计师 Glen Murphy 聊了聊，谈到了团队当年的愿景，以及他们是如何被现实“上了一课”的：

*“我们把用户访问过的所有网页都保存了下来，就像一个全文索引。这样你就能搜索一切。历史记录本应是个超棒的东西。一旦用户能访问他们的全部历史，就能解锁超多洞察。
但最后，这些都无所谓了。根本没人用历史记录。他们只是回到谷歌，把想找的东西再搜一遍。”
—— Glen Murphy*

这简直是（无奈的）理所当然。

人们根本不想要一个花哨的界面，来帮他们梳理历史，分析自己作为“互联网领航员”的见解。他们只是想找到前几天读过的那篇文章，或者去年秋天做过的那个南瓜派食谱。而“再搜一次”显然更简单。

倒不是说“索引历史”这个行为错了。恰恰相反，它非常有用。但“历史”本身不需要成为一个光鲜亮丽的功能。它完全可以“退居幕后”，默默地为搜索建议提供支持、显示快捷方式，并在用户偶尔真的需要追溯足迹时派上用场。

Chrome 发布时，它的个性化起始页就体现了这一点。它只显示你最常访问的网页、最近的搜索、书签和最近关闭的标签页。如果你想要更多，完整的历史记录被“藏”在了低调的快捷键“Command + Y”后面。

这些产品基础从一开始就非常扎实。随着时间的推移，Chrome 的历史界面几乎没怎么大改，主要只是在视觉风格上做了些现代化更新。

大语言模型 (LLM) + 历史记录

今天，AI 团队正在“梦回当年”，重演 Chrome 团队有过的对话。有趣的是，有些甚至就是同一拨人（比如 Ben Goodger，他曾帮助构建了 Chrome，现在在 OpenAI 领导 Atlas 的工程团队）。

大语言模型 (LLM) 中的用户历史，很可能重蹈网页历史的覆辙。虽然它功能强大、潜力无限，但大多数人不会把“聊天历史”当作一个专门要去的“目的地”。相反，它将默默地为产品赋能，使其变得更智能、更个性化、更高效。

用户永远会选择“阻力最小的路径”。（（这是用户体验设计的一个重要原则））我们应该追随这条路径，并让它变得更好。就像网页搜索一样，重新开始一个新聊天，往往比翻旧账更容易。这没问题。我们就该为此而设计。要考虑清楚，哪些东西是用户真的会回来看的，而哪些东西只应该在幕后被悄悄记录。

基于这些原则，这里有几个针对 AI 的具体设计建议：

让聊天变得“易抛弃”。让“重新开始”成为常态。不要让用户背上“搞懂模型如何处理历史”的认知负担。
把重复利用的内容“浮上来”。如果用户反复查看某些特定聊天，就把它们在界面上置顶（就像 Chrome 的“最常访问页面”）。
添加轻量级的记忆。允许用户收藏（bookmark）他们可能想重温的聊天或聊天片段。
让搜索变得有意义。当用户搜索时，带他们直达答案，而不是把他们扔到一个包含关键词的聊天的末尾。高亮显示相关的短语或段落，以便快速浏览。这方面已经有很多成熟的模式可以借鉴了。

大语言模型（LLM）记忆的复杂性

当然，我们希望用户体验到的“简单”，其背后隐藏的是一套复杂的记忆架构。记忆分很多层：聊天内的短期“工作记忆”、跨会话的长期记忆、持久化的个人记忆，以及从存储知识中检索信息的系统。

而且，每个模型的工作方式都不同。Claude 在单次会话中拥有强大的短期记忆，但每次新聊天都会“从零开始”。ChatGPT 在单次对话中记忆力稍差，但能跨会话记住“关键事实”和偏好。Gemini 可以处理超长的提示词，并整合来自谷歌其他产品的信息，但（（指文章写作时））还没有建立持久的个人记忆。

这些差异使得设计师很难帮用户建立一致的心智模型（（即用户对一个系统如何工作的理解））。但是，产品越是能将这种复杂性从用户面前移开，只呈现一个简单、连贯的历史模型，效果就越好。

相比之下，用户从不需要理解 Chrome 在幕后处理历史的复杂细节。它就是好用。Chrome 的历史模型给人的感觉既简单又合理：

透明的历史：你访问的每个页面都会被记录，并按时间倒序查看，带有日期和时间戳。
附加值：Chrome 使用这些数据来推荐和快捷访问你最常去的网站。
书签：你可以保存重要的内容。书签会出现在搜索结果中，也可以在书签管理器中找到。
可退出：如果你不想保存某些内容，一键即可进入“隐身模式”。

大语言模型（LLM）历史的未来

这里的核心教训是：保持简单、连贯，并在可能的情况下使其“隐形”。不是所有的功能都需要一个用户界面（UI），很多功能在只有极简界面的情况下反而会更“香”。

AI 团队应该把用户历史当作强大的基础设施，而不是一个面向用户的功能。它是一个后台数据集，可以极大地增强核心产品的个性化、上下文理解和信息召回能力。

Chrome 团队牢记了这些教训，将精力集中在核心产品功能上，并在合适的地方将历史记录“编织”了进去。

*“说到底，我们意识到，把最基础的 UI 搞对是极其重要的。如果你多出一个月的时间，那么把核心 UI 改进 1%，也比把一个根本没人用的边缘功能改进 100% 要强得多。”
—— Glen Murphy*

“历史”的职责不是为了“被记住”，而是为了让其他一切变得更顺畅。最好的设计，就是让历史“活在”幕后，在需要时才融入体验，推动用户不断向前。

来源： https://substack.com/@elizlaraki/p-178008945