Retrieval 模块
2025/12/26大约 2 分钟
Retrieval 模块
简介
Retrieval直接翻译过来即“检索”,本章Retrieval模块包括与检索步骤相关的所有内容,例如数据的获
取、切分、向量化、向量存储、向量检索等模块。常被应用于构建一个“ 企业/私人的知识库 ”,提升大
模型的整体能力。
设计意义:
LLM无法学习到所有的专业知识细节,因此在 面向专业领域知识 的提问时,无法给出
可靠准确的回答,甚至会“胡言乱语”,这种现象称之为 LLM的==“幻觉”== 。
大模型生成内容的不可控,尤其是在金融和医疗领域等领域,一次金额评估的错误,一次医疗诊断的失
误,哪怕只出现一次都是致命的。但,对于非专业人士来说可能难以辨识。目前还没有能够百分之百解
决这种情况的方案。
当前大家普遍达成共识的一个方案:
首先,为大模型提供一定的上下文信息,让其输出会变得更稳定。
其次,利用本章的RAG,将检索出来的 文档和提示词 输送给大模型,生成更可靠的答案。
RAG
可以说,当应用需求集中在利用大模型去回答特定私有领域的知识 ,且知识库足够大,那么除了 微调大模
型 外, RAG 就是非常有效的一种缓解大模型推理的“幻觉”问题的解决方案。
RAG的优点
1)相比提示词工程,RAG有 更丰富的上下文和数据样本 ,可以不需要用户提供过多的背景描述,就能生
成比较符合用户预期的答案。
2)相比于模型微调,RAG可以提升问答内容的 时效性 和 可靠性
3)在一定程度上保护了业务数据的 隐私性 。
RAG的缺点
1)由于每次问答都涉及外部系统数据检索,因此RAG的 响应时延 相对较高。
2)引用的外部知识数据会 消耗大量的模型Token 资源。
