RAG 总览¶
RAG 是 Retrieval-Augmented Generation 的缩写,中文常译为“检索增强生成”。
它解决的是:模型不一定知道你的私有资料,怎么让它先查资料,再组织答案。
它在解决什么问题¶
LLM 有几个天然限制:
- 不一定知道最新信息
- 不一定知道你的私有文档
- 直接回答时可能会“编”
RAG 的思路就是先检索,再生成,把外部资料接进来。
最小流程¶
- 切分文档
- 向量化
- 检索
- 重排
- 生成
一个最小系统长什么样¶
- 文档库:存你的资料
- 检索器:找相关片段
- 生成器:把片段整理成答案
这三块缺一块,RAG 就不完整。
你先记住¶
- 文档不是直接喂给模型就完事
- 检索质量会直接影响答案质量
- 切分、召回、重排都很关键
学完这一章的目标¶
你应该能回答:
- 为什么需要 RAG
- 一个最小 RAG 系统长什么样
- 哪些错误会让 RAG 变得很差