Lab 3: RAG 基础¶
背景¶
你已经知道 RAG 是“先检索,再生成”,但你还没真正拆过它。
这一题要训练的是:从一个简单知识库出发,理解最小 RAG 流程。
目标¶
设计一个最小 RAG 流程,并说明每一步在做什么。
输入材料¶
假设你有三段文档:
text
1. Hello-AI 面向中文小白。
2. RAG = 检索增强生成。
3. 检索结果质量会影响答案质量。
提示与约束¶
你要给出:
- 切分方案
- 检索思路
- 生成方式
- 一个常见问题
参考答案¶
text
1. 切分:按句子或短段落切分
2. 检索:先根据问题找最相关的片段
3. 生成:把检索到的片段和问题一起发给模型
4. 问题:如果切分太碎或召回太差,答案就会偏
扩展思考¶
- 什么情况下需要重排
- 什么情况下需要更好的切分
- 什么情况下要补充引用来源
本地复现方式¶
- 随便准备 3 到 5 段说明文字
- 让模型回答一个只依赖这些文字的问题
- 观察它有没有引用到正确内容