跳转至

Lab 3: RAG 基础

背景

你已经知道 RAG 是“先检索,再生成”,但你还没真正拆过它。

这一题要训练的是:从一个简单知识库出发,理解最小 RAG 流程。

目标

设计一个最小 RAG 流程,并说明每一步在做什么。

输入材料

假设你有三段文档:

text 1. Hello-AI 面向中文小白。 2. RAG = 检索增强生成。 3. 检索结果质量会影响答案质量。

提示与约束

你要给出:

  • 切分方案
  • 检索思路
  • 生成方式
  • 一个常见问题

参考答案

text 1. 切分:按句子或短段落切分 2. 检索:先根据问题找最相关的片段 3. 生成:把检索到的片段和问题一起发给模型 4. 问题:如果切分太碎或召回太差,答案就会偏

扩展思考

  • 什么情况下需要重排
  • 什么情况下需要更好的切分
  • 什么情况下要补充引用来源

本地复现方式

  1. 随便准备 3 到 5 段说明文字
  2. 让模型回答一个只依赖这些文字的问题
  3. 观察它有没有引用到正确内容