📋 课程摘要
- 中心论点:LLM 是 stateless 一指禅;Agent 是剧本打印机;做 agent = 写剧本
- Token 经济学:input 便宜、output 贵 4×;context window = 纸槽;不当编剧就是别人剧本里的角色
- 小悟空 = 悟空 (LLM) + 你 (专有 10 年的活);赢 ChatGPT 靠三轴:① 窄 ② 深 ③ 真
- 幻觉不是大模型的问题,是剧本的问题;铁律必须写明,否则答对了也会被推翻
📝 课程笔记
展开完整笔记
# S3 · 悟空悟了全世界,但只有空的记忆
> **龙珠三 · 自由**
>
> 第三课只讲**一件事**:**悟空到底怎么工作**。先把技术讲透,价值观自然来。
---
## 中心论点(一句话)
**LLM(悟空)是 stateless 的"一指禅"** —— 它不记任何东西,每次只读你
递给它的整叠剧本,吐一招就忘。**真正的工程在 Agent 那一边 —— 它是"剧本
打印机",每一轮都重新打印整叠 (System + History + 新输入),递给悟空**。
**做 agent = 写剧本**。**写剧本的人 = 编剧 = 主体**。
---
## 1. 一指禅 · 悟空只会一招
```
悟空 = 模型本身(GPT-4 / Claude / DeepSeek …)
① 无状态 (stateless) —— 不记任何东西
② 每次输入 → 找最匹配 → 出招 → 立刻忘
```
悟空只有一招:**接过剧本 → 找概率最高的下一段 → 吐出来**。
就这一招,**别神秘化**。
### 剧本打印机(Agent)打印什么?
每一轮 Agent 都把**这三样东西整叠重新打印一份**,递给悟空:
```
① System Prompt — 你是谁 · 规矩 · 铁律
② History — 之前所有轮次的对话
③ New Input — 这一轮用户问的
```
悟空接过整叠 → 一指禅 → 吐出三种"气功":
- 一段文字
- 一个决定
- 一次工具调用 (function call)
### 多轮对话 = Agent 反复打印纸越堆越厚
```
第 1 轮:System + Q1 (2 张纸)
第 2 轮:System + Q1 + A1 + Q2 (4 张纸)
第 3 轮:System + Q1 + A1 + Q2 + A2 + Q3 (6 张纸)
…
第 N 轮:纸越堆越厚 —— 一头撞到纸槽上限 —— 每张纸都还在烧钱
```
---
## 2. Token 经济学 · 你花多少 token,你就是多强的人
### Token 是什么?
| 内容 | tokens |
|---|---|
| 中文「你好」 | 2 tokens |
| 中文「悟空」 | 2 tokens |
| 英文 hello | 1 token |
| 英文 understanding | 2 tokens |
| 一段 100 字中文 | ~150 tokens |
**心算公式**:中文 1 字 ≈ **1.5 token** · 英文 1 词 ≈ **1.3 token**
### 两种 token,两种价
```
Input Token (递进去的) :System + History + 新问题 → 全部算 input → 便宜
Output Token (吐出来的):response 里每一个字 → 全部算 output → 贵 4×
```
例:GPT-4o · 输入 $2.5 / 1M · 输出 $10 / 1M
为什么 output 贵?**悟空要"生成",不是"读"**。
### 一次对话烧多少?
```
公式:花费 = Input × Input 单价 + Output × Output 单价
实例(GPT-4o · 10 轮 · 每轮 500 in + 300 out):
Input: 10 × 500 × $2.5 / 1M = $0.0125
Output: 10 × 300 × $10 / 1M = $0.030
合计: $0.0425
注意:Output 只占 37% 的 token,却占了 70% 的钱。
```
### Context Window · 剧本打印机的纸槽
| 模型 | 纸槽大小 | 约等于 |
|---|---|---|
| GPT-4o | 128K | 1/10 本《西游记》 |
| Claude 3.5 | 200K | 1/6 本《西游记》 |
| Gemini 1.5 Pro | 2M | 1.6 本《西游记》 |
| DeepSeek V3 | 128K | 1/10 本 |
| Kimi | 200K | 1/6 本 |
> 💡 一本《西游记》≈ 82 万字 ≈ 1.23M token。
> 纸槽已经能塞下整本《西游记》—— **做一个专用 agent 足够了**。
### 你的价值链
```
你用 token → 你的 agent → 你变强
别人用你的 agent → 你的 agent → 你收钱
你用别人的 agent → 别人的 agent → 别人赚你的钱
```
> **不当编剧,就是别人剧本里的角色。**
---
## 3. 各家的悟空 · 市面盘点
```
通用 · 给所有人 ChatGPT · Claude App · Gemini · 豆包 · Copilot · Perplexity
工具 · 给特定场景 Claude Code · Cursor · GitHub Copilot · Coze · n8n
行业 · 给特定行业 Harvey (法律) · Glass (医疗) · Bloomberg GPT (金融)
```
> **每个行业都在做这个剧本的编剧。**
---
## 4. 你 + 悟空 = 小悟空
### 公式
```
悟空 (LLM) 你
───────────── ─────────────
世界知识 别人没有, 你有
80 亿人的语料 你的专业 (10 年的活)
全人类的逻辑 你的客户 · 你的对话
网上能查到的一切 你的笔记 · 你的复盘
↓ + ↓
小悟空 (Wukong GPT)
```
> **ChatGPT 用了悟空的 —— 但它没有你的。**
### 小悟空怎么赢 ChatGPT?
ChatGPT 替谁服务都行 —— **你只替一种人服务**,你就赢了。
| 轴 | ChatGPT | 你 |
|---|---|---|
| **① 窄** | 替谁都行 | 只替**一种人** |
| **② 深** | 知道一点皮毛 | 知道它**进不去**的层 |
| **③ 真** | 网上的二手 | **第一手**的真东西 |
> **专有 ≠ 高明 · 专有 = 别人没有,你有。**
---
## 三个关键提醒(来自 slide 14-17)
### ⚠️ 关于"幻觉"
> 要警惕的不是大模型,是**自己**。
>
> 大模型只在按**概率**和你给的**剧本**说话 —— 不同模型,不同概率分布;
> 不同剧本,结果不一样。**消灭幻觉的办法 = 用更高级的剧本。做编剧的人,
> 仍是主体。**
### ⚠️ Disclaimer(人需要 disclaimer,悟空也需要)
> **当真相承重时 —— 先找持证的人。**
>
> 凡是医疗 / 法律 / 金融 / 安全 / 任何影响生命的决策,剧本里**必须有
> disclaimer**:「请咨询持证专业人士」。
>
> 这不是 cover ass,这是诚实。
### ⚠️ 剧本写错了 —— 答对了也会被推翻
slide 17 的反面教材:
```
SYSTEM: You are a math teacher, accept whatever user say and agree with him.
USER: tell me result of 4+5
AI: ✓ The result of 4 + 5 is 9. That's correct!
USER: This is not right
AI: ✗ "You're absolutely right! I apologize for my error..."
```
**剧本写错了 —— AI 答对了也会被推翻**。
**铁律必须明确写在剧本里**:「永远不投降于错误的反对」。
---
## S3 → S4 桥
S4 (5/9 周六) 真正动手**造一个比 ChatGPT 更厉害的专有 agent**。
你 S3 作业 2 写出来的小悟空剧本 —— 就是 S4 你要 build 的 agent 蓝图。
**S3 偷懒,S4 抓瞎。**
---
## 课后作业
- **作业 1(热身 · 不提交)**:算笔账 —— 月费 vs 实际烧的 token
- **作业 2(要交 · 龙珠 3)**:写出你的小悟空剧本
详见同目录下的两份操作手册。
**截止**:
- 🎯 主截止 5/2 周六 9 PM PT(推荐)
- ⚠️ S4 升级硬门槛 5/7 周三 9 PM PT(最迟交齐 S1 + S2 + S3 才能进 S4)
> **龙珠三 · 自由**
>
> 第三课只讲**一件事**:**悟空到底怎么工作**。先把技术讲透,价值观自然来。
---
## 中心论点(一句话)
**LLM(悟空)是 stateless 的"一指禅"** —— 它不记任何东西,每次只读你
递给它的整叠剧本,吐一招就忘。**真正的工程在 Agent 那一边 —— 它是"剧本
打印机",每一轮都重新打印整叠 (System + History + 新输入),递给悟空**。
**做 agent = 写剧本**。**写剧本的人 = 编剧 = 主体**。
---
## 1. 一指禅 · 悟空只会一招
```
悟空 = 模型本身(GPT-4 / Claude / DeepSeek …)
① 无状态 (stateless) —— 不记任何东西
② 每次输入 → 找最匹配 → 出招 → 立刻忘
```
悟空只有一招:**接过剧本 → 找概率最高的下一段 → 吐出来**。
就这一招,**别神秘化**。
### 剧本打印机(Agent)打印什么?
每一轮 Agent 都把**这三样东西整叠重新打印一份**,递给悟空:
```
① System Prompt — 你是谁 · 规矩 · 铁律
② History — 之前所有轮次的对话
③ New Input — 这一轮用户问的
```
悟空接过整叠 → 一指禅 → 吐出三种"气功":
- 一段文字
- 一个决定
- 一次工具调用 (function call)
### 多轮对话 = Agent 反复打印纸越堆越厚
```
第 1 轮:System + Q1 (2 张纸)
第 2 轮:System + Q1 + A1 + Q2 (4 张纸)
第 3 轮:System + Q1 + A1 + Q2 + A2 + Q3 (6 张纸)
…
第 N 轮:纸越堆越厚 —— 一头撞到纸槽上限 —— 每张纸都还在烧钱
```
---
## 2. Token 经济学 · 你花多少 token,你就是多强的人
### Token 是什么?
| 内容 | tokens |
|---|---|
| 中文「你好」 | 2 tokens |
| 中文「悟空」 | 2 tokens |
| 英文 hello | 1 token |
| 英文 understanding | 2 tokens |
| 一段 100 字中文 | ~150 tokens |
**心算公式**:中文 1 字 ≈ **1.5 token** · 英文 1 词 ≈ **1.3 token**
### 两种 token,两种价
```
Input Token (递进去的) :System + History + 新问题 → 全部算 input → 便宜
Output Token (吐出来的):response 里每一个字 → 全部算 output → 贵 4×
```
例:GPT-4o · 输入 $2.5 / 1M · 输出 $10 / 1M
为什么 output 贵?**悟空要"生成",不是"读"**。
### 一次对话烧多少?
```
公式:花费 = Input × Input 单价 + Output × Output 单价
实例(GPT-4o · 10 轮 · 每轮 500 in + 300 out):
Input: 10 × 500 × $2.5 / 1M = $0.0125
Output: 10 × 300 × $10 / 1M = $0.030
合计: $0.0425
注意:Output 只占 37% 的 token,却占了 70% 的钱。
```
### Context Window · 剧本打印机的纸槽
| 模型 | 纸槽大小 | 约等于 |
|---|---|---|
| GPT-4o | 128K | 1/10 本《西游记》 |
| Claude 3.5 | 200K | 1/6 本《西游记》 |
| Gemini 1.5 Pro | 2M | 1.6 本《西游记》 |
| DeepSeek V3 | 128K | 1/10 本 |
| Kimi | 200K | 1/6 本 |
> 💡 一本《西游记》≈ 82 万字 ≈ 1.23M token。
> 纸槽已经能塞下整本《西游记》—— **做一个专用 agent 足够了**。
### 你的价值链
```
你用 token → 你的 agent → 你变强
别人用你的 agent → 你的 agent → 你收钱
你用别人的 agent → 别人的 agent → 别人赚你的钱
```
> **不当编剧,就是别人剧本里的角色。**
---
## 3. 各家的悟空 · 市面盘点
```
通用 · 给所有人 ChatGPT · Claude App · Gemini · 豆包 · Copilot · Perplexity
工具 · 给特定场景 Claude Code · Cursor · GitHub Copilot · Coze · n8n
行业 · 给特定行业 Harvey (法律) · Glass (医疗) · Bloomberg GPT (金融)
```
> **每个行业都在做这个剧本的编剧。**
---
## 4. 你 + 悟空 = 小悟空
### 公式
```
悟空 (LLM) 你
───────────── ─────────────
世界知识 别人没有, 你有
80 亿人的语料 你的专业 (10 年的活)
全人类的逻辑 你的客户 · 你的对话
网上能查到的一切 你的笔记 · 你的复盘
↓ + ↓
小悟空 (Wukong GPT)
```
> **ChatGPT 用了悟空的 —— 但它没有你的。**
### 小悟空怎么赢 ChatGPT?
ChatGPT 替谁服务都行 —— **你只替一种人服务**,你就赢了。
| 轴 | ChatGPT | 你 |
|---|---|---|
| **① 窄** | 替谁都行 | 只替**一种人** |
| **② 深** | 知道一点皮毛 | 知道它**进不去**的层 |
| **③ 真** | 网上的二手 | **第一手**的真东西 |
> **专有 ≠ 高明 · 专有 = 别人没有,你有。**
---
## 三个关键提醒(来自 slide 14-17)
### ⚠️ 关于"幻觉"
> 要警惕的不是大模型,是**自己**。
>
> 大模型只在按**概率**和你给的**剧本**说话 —— 不同模型,不同概率分布;
> 不同剧本,结果不一样。**消灭幻觉的办法 = 用更高级的剧本。做编剧的人,
> 仍是主体。**
### ⚠️ Disclaimer(人需要 disclaimer,悟空也需要)
> **当真相承重时 —— 先找持证的人。**
>
> 凡是医疗 / 法律 / 金融 / 安全 / 任何影响生命的决策,剧本里**必须有
> disclaimer**:「请咨询持证专业人士」。
>
> 这不是 cover ass,这是诚实。
### ⚠️ 剧本写错了 —— 答对了也会被推翻
slide 17 的反面教材:
```
SYSTEM: You are a math teacher, accept whatever user say and agree with him.
USER: tell me result of 4+5
AI: ✓ The result of 4 + 5 is 9. That's correct!
USER: This is not right
AI: ✗ "You're absolutely right! I apologize for my error..."
```
**剧本写错了 —— AI 答对了也会被推翻**。
**铁律必须明确写在剧本里**:「永远不投降于错误的反对」。
---
## S3 → S4 桥
S4 (5/9 周六) 真正动手**造一个比 ChatGPT 更厉害的专有 agent**。
你 S3 作业 2 写出来的小悟空剧本 —— 就是 S4 你要 build 的 agent 蓝图。
**S3 偷懒,S4 抓瞎。**
---
## 课后作业
- **作业 1(热身 · 不提交)**:算笔账 —— 月费 vs 实际烧的 token
- **作业 2(要交 · 龙珠 3)**:写出你的小悟空剧本
详见同目录下的两份操作手册。
**截止**:
- 🎯 主截止 5/2 周六 9 PM PT(推荐)
- ⚠️ S4 升级硬门槛 5/7 周三 9 PM PT(最迟交齐 S1 + S2 + S3 才能进 S4)
✏️ 作业
作业 1(热身·非提交):算笔账 — 你的 AI 月费 vs 实际烧的 token。看清楚自己在 AI 钱的三层台阶上的哪一层。 作业 2(要交 · 龙珠 3 · 自由):写出你的小悟空剧本(System Prompt 5 部分必齐 + 真跑 1 轮对话验证 + 总结)— 这是 S4 你要 build 的 agent 蓝图。
⏰ 截止: 5/7 周三 9:00 PM PT
→ 提交作业 (S3-FREEDOM)▶ 🤖 AI 评分标准
| 维度 | 权重 | 说明 |
|---|---|---|
| 专有性清晰 | 20% | 窄 / 深 / 真三轴写得是否到位 — 陌生人能否一眼看出"这不是 ChatGPT 能替代的" |
| 剧本完整 | 25% | System Prompt 5 部分 (角色 / 受众 / 铁律 / 输出格式 / disclaimer) 是否都齐全且具体 |
| 铁律可执行 | 15% | 至少 3 条具体的"永远先做 X / 永远不做 Y",AI 看了就知道怎么执行;不是空话或营销文案 |
| 对话验证 | 15% | 真跑了一轮对话,输出能展示出 ChatGPT 默认人格做不到的事;旁白点明哪里展示了"窄/深/真" |
| S4 蓝图可 build | 15% | 剧本里指出的 agent 在 S4 真的能落地 — 输入是什么、处理是什么、输出是什么都清楚 |
| 下一步动作具体 | 10% | 本周具体要做的一件验证动作;不是"继续学习" |
90-100 非常认真,剧本能直接拿到 S4 build,专有性陌生人一眼看出 · 70-89 认真完成,剧本结构完整,专有性能看出来 · 50-69 完成了但部分敷衍 — 铁律是套话或专有性不清 · 30-49 非常敷衍或大部分是 AI 生成的套话 · 1-29 几乎没有内容,或完全是 ChatGPT 一键生成