RAPTOR:树状组织的递归抽象检索技术 [译]
通过检索增强的语言模型,我们能更灵活地跟上世界的变化,并融入更广泛的知识。但现有的大多数方法只能从资料库中取得短小连贯的文本片段,这限制了对文档整体情境的深入了解。我们提出了一个创新的做法:通过递归地嵌入、分类和概括文本块,我们从底层向上构建了一个分层总结的树状结构。在进行推理时,RAPTOR 模型能够从这棵树中检索信息,使我们能够在不同层次上整合长篇文档的信息。通过控制实验,我们发现,相比传统的检索增强语言模型,在多个任务上采用递归概括检索的方法显著提高了性能。特别是在需要复杂多步推理的问答任务上,我们的方法取得了前所未有的效果。举个例子,结合 RAPTOR 的检索能力和 GPT-4 的强大计算,我们在 QuALITY 问答基准测试上实现了 20% 的准确率提升。
February 5, 2024
View Article