5 Superpowers
想象这样一个场景:你告诉 Claude Code”帮我分析 CFPS 2020 的教育回报率”,它立刻开始写代码——读取数据、建模、输出结果。十分钟后,你发现它把连续变量当成了分类变量,没有控制你认为关键的家庭背景因素,输出格式也不是你需要的。你纠正一处,它调整;你再提出另一个问题,它再调整。来来回回,最终花掉的时间比你自己写还多。
这种体验并不罕见。问题不在于 Claude Code 能力不足,而在于它太急于动手了——在充分理解你的意图之前就开始行动。
Superpowers 解决的就是这个问题。它是一套给 Claude Code 安装”工作习惯”的插件:在写任何代码之前,先问你几个关键问题;明确方向之后,再系统地拆解任务、一步步执行、最后验证结果。整个过程更像一个有条理的研究助理,而不是一个急于交差的实习生。
Superpowers 的安装方法已在 章节 4.3.1 中介绍。如果还没安装,可以先回去完成安装,再继续阅读本章。
5.1 核心理念:先想后做
Superpowers 背后有四个核心原则。用研究者熟悉的语言来说:
- 先设计再动手:就像写论文前要列提纲、做实地研究前要写研究设计一样,复杂任务在开始之前值得花几分钟把方向确认清楚。
- 小步前进,随时可验证:把大任务切成能在几分钟内完成并验证的小步骤,而不是一次性生成几百行代码再从头排查。
- 用证据说话:不靠猜测,不靠感觉——代码能不能跑、结果对不对,都要有实际验证的输出为凭据。
- 做完要证明:在宣布”任务完成”之前,必须真正运行一遍,确认结果符合预期。
这四个原则组成了一套七阶段的工作流。你不需要记住所有细节——Superpowers 安装后会自动触发相关阶段。理解它的大体结构就够了:
你提出需求
│
▼
[头脑风暴] — Claude 通过问答确认方向,提出方案供你选择
│
▼
[任务拆解] — 把工作分成一个个 2–5 分钟的小步骤
│
▼
[子代理执行] — 按步骤逐一实现,每步完成后验证
│
▼
[代码审查] — 自动检查代码质量和正确性
│
▼
[验证完成] — 确认最终结果符合你的要求,才宣告完成
不必理解每个阶段的技术细节。这套流程对你来说大部分是透明的——你只需要在头脑风暴阶段回答几个问题,之后 Claude Code 会自己推进。本章的重点是帮你理解为什么这么做,以及如何从头脑风暴中获得最大收益。
5.2 头脑风暴:最重要的一步
在所有环节中,头脑风暴是最值得你主动参与的一步,也是 Superpowers 对研究者最有价值的地方。
5.2.1 为什么要先聊再做
想想你在现实中是怎么和研究助理合作的。你不会走过去说”帮我分析数据”就转身离开——你会解释研究背景、说明因变量是什么、讨论应该控制哪些变量、约定输出格式。这些对话看起来在”浪费时间”,但实际上能避免助理返工三次。
Claude Code 也一样。它接到一个宽泛的指令时,必须在脑子里填补大量空白——每一个填补都可能和你的真实意图有偏差。头脑风暴把这些空白变成明确的问题,在写第一行代码之前就和你确认好。
5.2.2 头脑风暴的工作方式
触发头脑风暴后,Claude Code 会进入一种特殊的对话模式:
- 每次只问一个问题,不会一次抛出一大堆表格让你填
- 问题通常是选择题——提供几个选项,你选一个或者补充说明
- 收集到足够信息后,Claude 会提出 2–3 个备选方案,说明各自的优缺点,并给出它的推荐
- 你确认之后,Claude 才开始写代码
触发方式很简单——在描述任务时使用”帮我做”或”我想要”这样的完整需求表述,Claude Code 就会判断是否需要先进行头脑风暴。
帮我分析 CFPS 2020 数据中家庭教育投入对子女学业表现的影响,
包括描述性统计和回归分析,最终输出一篇可以直接放进论文的报告。5.2.3 一次完整的头脑风暴:教育回报率分析
下面展示的是一次真实的头脑风暴对话节选,让你感受一下实际体验。
Claude 的第一个问题:
好的,我先了解一下这项分析的具体需求。
你的核心研究问题是什么?
A. 受教育年限对收入的影响(明瑟方程式,OLS 估计) B. 教育程度对职业地位的影响(有序结果,logit/probit) C. 父母教育对子女教育的代际传递(代际流动性) D. 其他(请描述)
你回答:A
Claude 的第二个问题:
内生性问题怎么处理?这会决定我们用什么估计方法。
A. 暂时不考虑,先做基础 OLS,在局限性部分注明 B. 使用工具变量(需要选择合适的工具变量,如出生年代×教育政策) C. 使用同胞固定效应控制家庭不可观测因素 D. 你有其他偏好的策略
你回答:A,需要在局限性部分提示内生性问题
Claude 的第三个问题:
控制变量方面,你希望包含哪些?
A. 基础版:性别、年龄、城乡(5 个变量以内) B. 标准版:基础 + 户口、省份固定效应、父母教育 C. 完整版:标准 + 家庭收入、职业、健康状况 D. 你来指定
你回答:B
经过类似的 4–5 轮问答,Claude 会给出一个方案总结:
根据我们的讨论,我推荐以下分析方案:
方案一(推荐):标准明瑟回归 + 稳健标准误 - 核心模型:ln(收入) ~ 受教育年限 + 性别 + 年龄 + 年龄² + 城乡 + 户口 + 省份固定效应 + 父母教育 - 估计方法:OLS,使用
estimatr::lm_robust()计算异方差稳健标准误 - 输出:三列回归表(基础/标准/含省份固定效应)+ 教育年限系数的可视化 - 推荐理由:符合社科文献惯例,局限性部分可专门讨论内生性方案二:分性别、分城乡子样本分析 - 在方案一基础上,额外报告分组回归结果 - 适合如果你的论文着重讨论异质性效应
方案三:Heckman 两步选择校正 - 处理样本选择偏误(仅对有工资收入的人可观测) - 复杂度较高,适合对就业选择问题有理论关注的研究
这时你可以直接确认、修改,或者要求调整。一旦你说”好的,按方案一来”,头脑风暴结束,Claude Code 开始进入任务拆解和执行阶段。
5.2.4 没有”太简单”的任务
一个常见的误解是:只有复杂任务才需要头脑风暴,简单任务直接做就行。
这种想法往往错得很彻底。“帮我做一个描述性统计表”这样的任务,藏着大量隐含决策:
- 要汇报哪些变量?全部还是核心变量?
- 要分组报告吗(按性别/城乡/年份)?
- 连续变量用均值+标准差,还是中位数+四分位数?
- 分类变量用频率还是比例?
- 表格格式:HTML、LaTeX 还是 Word?
- 有没有缺失值,要不要单独报告?
每个决定 Claude 都要做,做错任何一个你都得返工。把这些问题在 5 分钟的头脑风暴里过一遍,远比事后修改三次省时省力。
| 不用头脑风暴 | 用头脑风暴 |
|---|---|
| 立刻开始写代码 | 先用 5 分钟确认需求 |
| 依赖 Claude 的默认假设 | Claude 的决策基于你的实际需求 |
| 需要多轮修改才对 | 第一版基本就是你想要的 |
| 任务越复杂返工越多 | 任务越复杂,头脑风暴的价值越大 |
| 最终可能超出原始意图 | 严格控制在商定的范围内 |
如何从头脑风暴中获得最大收益:
- 描述需求时加入研究背景——是学位论文章节、期刊投稿还是课程作业?这会影响输出的规范程度。
- 不要敷衍地回答”随便”——每一个问题都有正确答案,就算你现在不确定,也可以说”我倾向于 X,但你来推荐”。
- 如果 Claude 提的方案里没有你想要的,直接说出来,它会相应调整。
- 头脑风暴的结论会保存成一份设计文档(spec),你可以要求 Claude 把它输出给你存档。
5.3 其他实用技能
除头脑风暴外,Superpowers 还包含几个在研究场景中很有价值的技能。它们大多在后台自动触发,你不需要主动调用,但了解它们的存在有助于你理解 Claude Code 的行为。
5.3.1 任务拆解(Writing Plans)
头脑风暴结束后,Claude Code 会把整个任务分解成一系列小步骤,每步通常只需要 2–5 分钟完成。每一步都有明确的目标和验证标准:完成了、没完成、还是遇到了阻碍。
这种拆解方式的好处是透明且可恢复。你可以随时查看任务进度,任何一步出错只影响那一步,不会让整个分析重来。对于像”完整复制一篇论文的分析”这样涉及十几个子步骤的任务,任务拆解能把不可控的大问题变成可管理的小问题。
5.3.2 系统调试(Systematic Debugging)
当代码报错时,Superpowers 要求 Claude Code 先找到根本原因,再开始修改。听起来理所当然,但没有这个约束,AI 的本能反应往往是”先改掉眼前的报错信息”——结果是修了 A 破了 B,越改越乱。
这个技能对研究者特别有价值。比如你的回归系数突然变了——Claude Code 不会直接猜测原因就动手,而是先系统地追溯:是数据读取有问题?变量编码改变了?还是控制变量集发生了变化?找到真实原因后再修复,修一次就彻底解决。
5.3.3 验证完成(Verification)
这个技能只做一件事:拒绝没有证据的”完成”声明。
Claude Code 在完成任务后必须实际运行代码、查看输出、确认结果符合预期,才能告诉你”完成了”。它不能说”代码看起来没问题”或”应该可以”——必须有实际运行的证据。
对研究者来说,这意味着你收到的每一份分析结果背后,都有一次实际的验证运行,而不只是”我觉得没问题”的判断。
5.3.4 代码审查(Code Review)
在完成一个较大的任务块后,Superpowers 会自动触发代码审查,检查代码的质量和正确性。审查会关注:
- 统计方法是否符合你在头脑风暴中确认的方案
- 变量定义和 CLAUDE.md 中的规范是否一致
- 有没有可能导致可重复性问题的硬编码路径或随机种子遗漏
- 代码是否整洁、易于将来维护
代码审查结果会直接呈现给你。如果审查发现了问题,Claude Code 会修复后再汇报——你看到的是”审查通过后的最终版本”,不是”审查前的初稿”。
5.4 一次完整的工作流
以一个具体任务为例,看看 Superpowers 是如何在幕后推动整个过程的:
我想分析 CGSS 2021 数据中社会信任对社区参与的影响,
用 OLS 做基础估计,再讨论一下可能的机制。
输出一张回归表和一张机制路径图,放进我的硕士论文。你输入这段话后,发生了什么:
头脑风暴启动(5–8 分钟) Claude Code 询问社会信任如何测量(单题量表 vs. 综合指数)、社区参与的操作化定义、控制变量范围、机制变量是否已有数据。你一一回答,双方确认使用五题综合信任指数、三类参与行为、标准人口学变量,机制分析先做中介检验。
任务拆解(自动,通常在后台) Claude Code 生成一份任务清单:读取并检查数据 → 构建综合指数 → 三个基础回归模型 → 输出回归表 → 中介分析 → 绘制路径图。
逐步执行 + 验证 每完成一步,Claude Code 运行代码验证结果,记录检查点。如果某步失败,它先找根本原因再修复,而不是反复猜测。
代码审查 + 验证完成 全部步骤完成后,自动审查代码质量,确认输出文件存在且格式正确,才告诉你任务完成。
你在整个过程中做的事:回答了头脑风暴的 5 个问题(约 5 分钟),然后等待结果。
5.5 什么时候值得用,什么时候不必用
Superpowers 不是每次对话都需要的。下面这张表帮你判断:
| 任务类型 | 是否值得 | 原因 |
|---|---|---|
| 完整的分析项目(多个模型 + 输出) | 非常值得 | 头脑风暴能防止大量返工 |
| 不熟悉的方法(分位数回归、空间分析……) | 非常值得 | 头脑风暴帮你确认方法选择 |
| 团队共享的代码 | 非常值得 | 审查和文档质量更高 |
| 需要复现他人分析 | 值得 | 任务拆解让进度可追踪 |
| 快速查看一个变量的分布 | 不必要 | 简单任务直接问就好 |
| 修改一处注释或变量名 | 不必要 | 头脑风暴开销大于收益 |
| 临时性的数据探索 | 视情况 | 短期任务酌情判断 |
刚开始时的建议:选一个你近期要做的真实分析任务(比如一套描述性统计 + 基础回归),完整走一遍 Superpowers 工作流。这比看任何介绍都更有说服力——你会直接感受到头脑风暴把你从”重做三遍”中解救出来的体验。
子代理机制是 Superpowers 工作流中执行阶段的底层支撑——如果你对子代理如何工作感兴趣,可以参见 章节 9.1 的详细介绍。