从 Chrome 早期的网页历史设计探索中,今天的 AI 产品能学到什么?

AI 历史的未来

作者:Substack

The Future of AI History

从 Chrome 早期的网页历史设计探索中,今天的 AI 产品能学到什么?


我们现在对 AI 聊天历史的思考,可能“想太多了”—— 就像当年 Chrome 对待网页历史那样。

故事要从近 20 年前说起。当时,谷歌的 Chrome 团队做了一件大事:他们为用户访问过的每一个网页都建立了完整的索引。这一下就创造出了一个极其丰富的数据集。设计师们兴奋地畅想:只要配上合适的界面,用户就能重新发现互联网,洞察自我,甚至将自己的数字足迹可视化。

但结果呢?历史功能的最佳用户界面(UI)原来是极其简单的。

网页历史的设计之路

2008 年那会儿,虽然所有浏览器都有“历史记录”功能,但几乎没人用。Chrome 团队相信它潜力无限——它应该是一个个性化的数据集,帮人们找回看过的内容,甚至理解自己的浏览模式。

设计师们热情高涨,一头扎了进去,勾画出各种天马行空的界面方案:有的像个性化的地铁路线图,有的像数据摘要,还有的做成了 Google 阅读器那样的信息流。

不久前,我和 Chrome 的第一位设计师 Glen Murphy 聊了聊,谈到了团队当年的愿景,以及他们是如何被现实“上了一课”的:

*“我们把用户访问过的所有网页都保存了下来,就像一个全文索引。这样你就能搜索一切。历史记录本应是个超棒的东西。一旦用户能访问他们的全部历史,就能解锁超多洞察。

但最后,这些都无所谓了。根本没人用历史记录。他们只是回到谷歌,把想找的东西再搜一遍。”

—— Glen Murphy*

这简直是(无奈的)理所当然。

人们根本不想要一个花哨的界面,来帮他们梳理历史,分析自己作为“互联网领航员”的见解。他们只是想找到前几天读过的那篇文章,或者去年秋天做过的那个南瓜派食谱。而“再搜一次”显然更简单。

倒不是说“索引历史”这个行为错了。恰恰相反,它非常有用。但“历史”本身不需要成为一个光鲜亮丽的功能。它完全可以“退居幕后”,默默地为搜索建议提供支持、显示快捷方式,并在用户偶尔真的需要追溯足迹时派上用场。

Chrome 发布时,它的个性化起始页就体现了这一点。它只显示你最常访问的网页、最近的搜索、书签和最近关闭的标签页。如果你想要更多,完整的历史记录被“藏”在了低调的快捷键“Command + Y”后面。

这些产品基础从一开始就非常扎实。随着时间的推移,Chrome 的历史界面几乎没怎么大改,主要只是在视觉风格上做了些现代化更新。

大语言模型 (LLM) + 历史记录

今天,AI 团队正在“梦回当年”,重演 Chrome 团队有过的对话。有趣的是,有些甚至就是同一拨人(比如 Ben Goodger,他曾帮助构建了 Chrome,现在在 OpenAI 领导 Atlas 的工程团队)。

大语言模型 (LLM) 中的用户历史,很可能重蹈网页历史的覆辙。虽然它功能强大、潜力无限,但大多数人不会把“聊天历史”当作一个专门要去的“目的地”。相反,它将默默地为产品赋能,使其变得更智能、更个性化、更高效。

用户永远会选择“阻力最小的路径”。((这是用户体验设计的一个重要原则))我们应该追随这条路径,并让它变得更好。就像网页搜索一样,重新开始一个新聊天,往往比翻旧账更容易。这没问题。我们就该为此而设计。要考虑清楚,哪些东西是用户真的会回来看的,而哪些东西只应该在幕后被悄悄记录。

基于这些原则,这里有几个针对 AI 的具体设计建议:

  • 让聊天变得“易抛弃”。让“重新开始”成为常态。不要让用户背上“搞懂模型如何处理历史”的认知负担。

  • 把重复利用的内容“浮上来”。如果用户反复查看某些特定聊天,就把它们在界面上置顶(就像 Chrome 的“最常访问页面”)。

  • 添加轻量级的记忆。允许用户收藏(bookmark)他们可能想重温的聊天或聊天片段。

  • 让搜索变得有意义。当用户搜索时,带他们直达答案,而不是把他们扔到一个包含关键词的聊天的末尾。高亮显示相关的短语或段落,以便快速浏览。这方面已经有很多成熟的模式可以借鉴了。

大语言模型(LLM)记忆的复杂性

当然,我们希望用户体验到的“简单”,其背后隐藏的是一套复杂的记忆架构。记忆分很多层:聊天内的短期“工作记忆”、跨会话的长期记忆、持久化的个人记忆,以及从存储知识中检索信息的系统。

而且,每个模型的工作方式都不同。Claude 在单次会话中拥有强大的短期记忆,但每次新聊天都会“从零开始”。ChatGPT 在单次对话中记忆力稍差,但能跨会话记住“关键事实”和偏好。Gemini 可以处理超长的提示词,并整合来自谷歌其他产品的信息,但((指文章写作时))还没有建立持久的个人记忆。

这些差异使得设计师很难帮用户建立一致的心智模型((即用户对一个系统如何工作的理解))。但是,产品越是能将这种复杂性从用户面前移开,只呈现一个简单、连贯的历史模型,效果就越好。

相比之下,用户从不需要理解 Chrome 在幕后处理历史的复杂细节。它就是好用。Chrome 的历史模型给人的感觉既简单又合理:

  • 透明的历史:你访问的每个页面都会被记录,并按时间倒序查看,带有日期和时间戳。

  • 附加值:Chrome 使用这些数据来推荐和快捷访问你最常去的网站。

  • 书签:你可以保存重要的内容。书签会出现在搜索结果中,也可以在书签管理器中找到。

  • 可退出:如果你不想保存某些内容,一键即可进入“隐身模式”。

大语言模型(LLM)历史的未来

这里的核心教训是:保持简单、连贯,并在可能的情况下使其“隐形”。不是所有的功能都需要一个用户界面(UI),很多功能在只有极简界面的情况下反而会更“香”。

AI 团队应该把用户历史当作强大的基础设施,而不是一个面向用户的功能。它是一个后台数据集,可以极大地增强核心产品的个性化、上下文理解和信息召回能力。

Chrome 团队牢记了这些教训,将精力集中在核心产品功能上,并在合适的地方将历史记录“编织”了进去。

*“说到底,我们意识到,把最基础的 UI 搞对是极其重要的。如果你多出一个月的时间,那么把核心 UI 改进 1%,也比把一个根本没人用的边缘功能改进 100% 要强得多。”

—— Glen Murphy*

“历史”的职责不是为了“被记住”,而是为了让其他一切变得更顺畅。最好的设计,就是让历史“活在”幕后,在需要时才融入体验,推动用户不断向前。


来源: https://substack.com/@elizlaraki/p-178008945