跳转至

RAG 总览

RAG 是 Retrieval-Augmented Generation 的缩写,中文常译为“检索增强生成”。

它解决的是:模型不一定知道你的私有资料,怎么让它先查资料,再组织答案。

它在解决什么问题

LLM 有几个天然限制:

  • 不一定知道最新信息
  • 不一定知道你的私有文档
  • 直接回答时可能会“编”

RAG 的思路就是先检索,再生成,把外部资料接进来。

最小流程

  1. 切分文档
  2. 向量化
  3. 检索
  4. 重排
  5. 生成

一个最小系统长什么样

  • 文档库:存你的资料
  • 检索器:找相关片段
  • 生成器:把片段整理成答案

这三块缺一块,RAG 就不完整。

你先记住

  • 文档不是直接喂给模型就完事
  • 检索质量会直接影响答案质量
  • 切分、召回、重排都很关键

学完这一章的目标

你应该能回答:

  • 为什么需要 RAG
  • 一个最小 RAG 系统长什么样
  • 哪些错误会让 RAG 变得很差