AI 基础总览¶
这一章回答"AI 到底是什么"。
如果你刚接触 AI,对下面这些词感到困惑,这章就是为你准备的:
- AI、机器学习、深度学习、大模型,它们到底是什么关系?
- LLM 为什么能"说人话"?
- Token、Embedding、温度这些词是什么意思?
- 为什么 AI 有时候会"一本正经地胡说"?
你会看到什么¶
| 章节 | 解决的核心问题 |
|---|---|
| 什么是 AI | AI 能做什么、不能做什么?ANI/AGI/ASI 是什么意思? |
| 机器学习 | 计算机是怎么"学习"的?监督/无监督/强化学习有什么区别? |
| 深度学习 | 神经网络是怎么一层一层"看懂"东西的?AlexNet 为什么重要? |
| 什么是 LLM | ChatGPT 背后的"引擎"到底是什么?它为什么能生成连贯文本? |
| 模型、数据、训练与推理 | 训练一次模型要花多少钱?"微调"是什么意思? |
| Token、Embedding 与上下文窗口 | 为什么中文 API 比英文贵?LLM 怎么"理解"文字? |
| 温度与采样参数 | 怎么让 AI 更"听话"或更"有创意"?Temperature 怎么调? |
| 为什么模型会胡说 | AI 幻觉是什么?怎么减少? |
推荐顺序¶
如果你时间有限,建议按这个顺序读:
text
什么是 AI → 什么是 LLM → Token、Embedding 与上下文窗口 → 为什么模型会胡说
这四篇是理解 LLM 的"最小必要知识"。
如果你想更系统地理解,可以按这个顺序:
text
什么是 AI → 机器学习 → 深度学习 → 什么是 LLM → 模型/数据/训练/推理 → Token/Embedding/上下文 → 温度与采样 → 为什么模型会胡说
学完之后¶
你应该能分清:
- AI:人工智能的总称,让机器表现出智能行为
- 机器学习(ML):AI 的一个分支,让计算机从数据里学规律
- 深度学习(DL):机器学习的一条路线,用多层神经网络处理复杂模式
- LLM:深度学习在语言方向上的产物,大语言模型
- 模型 vs 应用 vs 平台:模型是引擎,应用是整车,平台是4S店
而且你应该知道:
- LLM 不会"思考",它只是在预测下一个词
- AI 的输出不一定正确,涉及事实必须人工核查
- 温度、top-p 这些参数可以控制输出的随机性