Retrieval 模块

JustQ2025/12/26大约 2 分钟

Retrieval 模块

简介

Retrieval直接翻译过来即“检索”，本章Retrieval模块包括与检索步骤相关的所有内容，例如数据的获
取、切分、向量化、向量存储、向量检索等模块。常被应用于构建一个“ 企业/私人的知识库 ”，提升大
模型的整体能力。

设计意义：
LLM无法学习到所有的专业知识细节，因此在面向专业领域知识的提问时，无法给出
可靠准确的回答，甚至会“胡言乱语”，这种现象称之为 LLM的==“幻觉”== 。
大模型生成内容的不可控，尤其是在金融和医疗领域等领域，一次金额评估的错误，一次医疗诊断的失
误，哪怕只出现一次都是致命的。但，对于非专业人士来说可能难以辨识。目前还没有能够百分之百解
决这种情况的方案。

当前大家普遍达成共识的一个方案：
首先，为大模型提供一定的上下文信息，让其输出会变得更稳定。
其次，利用本章的RAG，将检索出来的文档和提示词输送给大模型，生成更可靠的答案。

RAG

可以说，当应用需求集中在利用大模型去回答特定私有领域的知识，且知识库足够大，那么除了微调大模
型外， RAG 就是非常有效的一种缓解大模型推理的“幻觉”问题的解决方案。

RAG的优点
1）相比提示词工程，RAG有更丰富的上下文和数据样本，可以不需要用户提供过多的背景描述，就能生
成比较符合用户预期的答案。
2）相比于模型微调，RAG可以提升问答内容的时效性和可靠性
3）在一定程度上保护了业务数据的隐私性。
RAG的缺点
1）由于每次问答都涉及外部系统数据检索，因此RAG的响应时延相对较高。
2）引用的外部知识数据会消耗大量的模型Token 资源。

Retrieval 模块

Retrieval 模块

简介

RAG

Retrieval 工作流程