← Back to T1S4 · Wukong Breaks Out of the Stone
T1S4 · Course material

📝 S4 Homework 1 Guide (warm-up · build two agents, compare script differences)

S4 作业 1(热身 · 非提交) — 建两个 agent,比剧本差异

这是 S4 的热身作业不需要提交

目的:让 S4 课上的「模型我选 + 数据我控」从两条宪法口号, 变成你亲眼看见的两段对话。同一道题,两份不同的剧本 跑出来的回答到底差在哪一层 —— 这件事 不是听课能听明白的,是自己开两个窗口比一遍才知道的。

30 分钟。一杯咖啡的时间,你能感受到 S5「精炼」要修哪一刀。


你要做的事(两步)

1. 建 Agent A:你的 S3 剧本原版

打开 悟空道场,在你账号里新建一个 agent

① 点 New Agent · 起个名字(比如「小悟空 A」)
② 把你 S3 的剧本**整段 paste 进去**当系统提示
③ 选一个 model
④ 把你 S3 剧本里的那个**真实场景**当用户输入贴进去
⑤ 拿到回答 → **整段拷下来**

2. 建 Agent B:改过的剧本

① 再点 New Agent · 起个名字(比如「小悟空 B」)
② 把你 S3 的剧本 paste 进去,然后**改两刀** ——
   改一条 Iron Law / 删一段冗余 / 加一句受众界定 / 换一个语气都行
③ 选**同一个 model**(跟 Agent A 一样)
④ 同一道题再问一遍
⑤ 整段拷下来

⚔️ 硬约束:两个 agent 只有剧本不同,model 和问题都一样。 你比的是剧本设计差异怎样改变输出,不是模型差异。


三轴对比 · 你看见了什么?

把 Agent A 跟 Agent B 的两段回答摆在一起,按这三轴真去看

问自己
🧠 思考层次 谁多走了一步(先验证假设 / 先拆问题 / 先反问用户)?
🔍 细节抓取 谁注意到了用户输入里那个没明说的暗扣?
🎭 你的味道 谁更像你的剧本写的那个角色?谁更像「ChatGPT 默认人格」漏出来了?

填给自己看(不交,但强烈建议写下来,不然 30 秒就忘):

🌪 哪些层次不同:________________________
🪡 哪些细节差别:________________________
🍵 我更喜欢哪一个:______(Agent A / Agent B)
   为什么:______________________________

三种典型情况 · 你属于哪一种?

🌱 第一种:Agent A 和 B 差异很大,改的那两刀明显改变了输出方向

意思:你的剧本对 agent 的控制力很强。 一条 Iron Law 的增删就能让整个回答换一个味道。

思考:S5 精炼的时候,每改一行都要跑一遍, 因为你的剧本已经到了「动一刀见一刀」的精度。

🌳 第二种:两边差不多,改了也没太大区别

意思:你的剧本可能太泛 —— model 在用自己的默认逻辑填空, 你的指令还没强到能「覆盖」model 的默认行为。

思考:S5 你需要把指令写得更具体、更锋利, 让 model 不得不按你的路走,而不是自由发挥。

🏆 第三种:Agent B 改了之后反而更好

意思:你的 S3 原版剧本里有冗余或矛盾 —— 删掉反而让 model 更专注在对的事上。

思考:这一条最值钱。S5 精炼的核心不是「加东西」—— 是删到只剩必须在的,让每一行都有存在的理由。


别忘了 S4 课上的话

"模型我选 · 数据我控 —— 悟空道场的第一条规矩。"

这道题不是为了让你"感受 AI 神奇" —— 是让你亲手摸一下: 你写的剧本对输出的掌控力到底有多大。 看清楚之后,S5 的精炼才有的放矢。

不需要提交,但强烈建议比完后给自己写一句话:

我这个 agent 最值得守住的那一招是:__________
我下周(作业 2)要把它**写明白**进剧本里。

—— 这一句话就是你 S5 的起点。