5 Superpowers

想象这样一个场景：你告诉 Claude Code”帮我分析 CFPS 2020 的教育回报率”，它立刻开始写代码——读取数据、建模、输出结果。十分钟后，你发现它把连续变量当成了分类变量，没有控制你认为关键的家庭背景因素，输出格式也不是你需要的。你纠正一处，它调整；你再提出另一个问题，它再调整。来来回回，最终花掉的时间比你自己写还多。

这种体验并不罕见。问题不在于 Claude Code 能力不足，而在于它太急于动手了——在充分理解你的意图之前就开始行动。

Superpowers 解决的就是这个问题。它是一套给 Claude Code 安装”工作习惯”的插件：在写任何代码之前，先问你几个关键问题；明确方向之后，再系统地拆解任务、一步步执行、最后验证结果。整个过程更像一个有条理的研究助理，而不是一个急于交差的实习生。

注释

Superpowers 的安装方法已在章节 4.3.1 中介绍。如果还没安装，可以先回去完成安装，再继续阅读本章。

5.1 核心理念：先想后做

Superpowers 背后有四个核心原则。用研究者熟悉的语言来说：

先设计再动手：就像写论文前要列提纲、做实地研究前要写研究设计一样，复杂任务在开始之前值得花几分钟把方向确认清楚。
小步前进，随时可验证：把大任务切成能在几分钟内完成并验证的小步骤，而不是一次性生成几百行代码再从头排查。
用证据说话：不靠猜测，不靠感觉——代码能不能跑、结果对不对，都要有实际验证的输出为凭据。
做完要证明：在宣布”任务完成”之前，必须真正运行一遍，确认结果符合预期。

这四个原则组成了一套七阶段的工作流。你不需要记住所有细节——Superpowers 安装后会自动触发相关阶段。理解它的大体结构就够了：

你提出需求
    │
    ▼
[头脑风暴] — Claude 通过问答确认方向，提出方案供你选择
    │
    ▼
[任务拆解] — 把工作分成一个个 2–5 分钟的小步骤
    │
    ▼
[子代理执行] — 按步骤逐一实现，每步完成后验证
    │
    ▼
[代码审查] — 自动检查代码质量和正确性
    │
    ▼
[验证完成] — 确认最终结果符合你的要求，才宣告完成

提示

不必理解每个阶段的技术细节。这套流程对你来说大部分是透明的——你只需要在头脑风暴阶段回答几个问题，之后 Claude Code 会自己推进。本章的重点是帮你理解为什么这么做，以及如何从头脑风暴中获得最大收益。

5.2 头脑风暴：最重要的一步

在所有环节中，头脑风暴是最值得你主动参与的一步，也是 Superpowers 对研究者最有价值的地方。

5.2.1 为什么要先聊再做

想想你在现实中是怎么和研究助理合作的。你不会走过去说”帮我分析数据”就转身离开——你会解释研究背景、说明因变量是什么、讨论应该控制哪些变量、约定输出格式。这些对话看起来在”浪费时间”，但实际上能避免助理返工三次。

Claude Code 也一样。它接到一个宽泛的指令时，必须在脑子里填补大量空白——每一个填补都可能和你的真实意图有偏差。头脑风暴把这些空白变成明确的问题，在写第一行代码之前就和你确认好。

5.2.2 头脑风暴的工作方式

触发头脑风暴后，Claude Code 会进入一种特殊的对话模式：

每次只问一个问题，不会一次抛出一大堆表格让你填
问题通常是选择题——提供几个选项，你选一个或者补充说明
收集到足够信息后，Claude 会提出 2–3 个备选方案，说明各自的优缺点，并给出它的推荐
你确认之后，Claude 才开始写代码

触发方式很简单——在描述任务时使用”帮我做”或”我想要”这样的完整需求表述，Claude Code 就会判断是否需要先进行头脑风暴。

帮我分析 CFPS 2020 数据中家庭教育投入对子女学业表现的影响，
包括描述性统计和回归分析，最终输出一篇可以直接放进论文的报告。

5.2.3 一次完整的头脑风暴：教育回报率分析

下面展示的是一次真实的头脑风暴对话节选，让你感受一下实际体验。

Claude 的第一个问题：

好的，我先了解一下这项分析的具体需求。

你的核心研究问题是什么？

A. 受教育年限对收入的影响（明瑟方程式，OLS 估计） B. 教育程度对职业地位的影响（有序结果，logit/probit） C. 父母教育对子女教育的代际传递（代际流动性） D. 其他（请描述）

你回答：A

Claude 的第二个问题：

内生性问题怎么处理？这会决定我们用什么估计方法。

A. 暂时不考虑，先做基础 OLS，在局限性部分注明 B. 使用工具变量（需要选择合适的工具变量，如出生年代×教育政策） C. 使用同胞固定效应控制家庭不可观测因素 D. 你有其他偏好的策略

你回答：A，需要在局限性部分提示内生性问题

Claude 的第三个问题：

控制变量方面，你希望包含哪些？

A. 基础版：性别、年龄、城乡（5 个变量以内） B. 标准版：基础 + 户口、省份固定效应、父母教育 C. 完整版：标准 + 家庭收入、职业、健康状况 D. 你来指定

你回答：B

经过类似的 4–5 轮问答，Claude 会给出一个方案总结：

根据我们的讨论，我推荐以下分析方案：

方案一（推荐）：标准明瑟回归 + 稳健标准误 - 核心模型：ln(收入) ~ 受教育年限 + 性别 + 年龄 + 年龄² + 城乡 + 户口 + 省份固定效应 + 父母教育 - 估计方法：OLS，使用 estimatr::lm_robust() 计算异方差稳健标准误 - 输出：三列回归表（基础/标准/含省份固定效应）+ 教育年限系数的可视化 - 推荐理由：符合社科文献惯例，局限性部分可专门讨论内生性

方案二：分性别、分城乡子样本分析 - 在方案一基础上，额外报告分组回归结果 - 适合如果你的论文着重讨论异质性效应

方案三：Heckman 两步选择校正 - 处理样本选择偏误（仅对有工资收入的人可观测） - 复杂度较高，适合对就业选择问题有理论关注的研究

这时你可以直接确认、修改，或者要求调整。一旦你说”好的，按方案一来”，头脑风暴结束，Claude Code 开始进入任务拆解和执行阶段。

5.2.4 没有”太简单”的任务

一个常见的误解是：只有复杂任务才需要头脑风暴，简单任务直接做就行。

这种想法往往错得很彻底。“帮我做一个描述性统计表”这样的任务，藏着大量隐含决策：

要汇报哪些变量？全部还是核心变量？
要分组报告吗（按性别/城乡/年份）？
连续变量用均值+标准差，还是中位数+四分位数？
分类变量用频率还是比例？
表格格式：HTML、LaTeX 还是 Word？
有没有缺失值，要不要单独报告？

每个决定 Claude 都要做，做错任何一个你都得返工。把这些问题在 5 分钟的头脑风暴里过一遍，远比事后修改三次省时省力。

不用头脑风暴	用头脑风暴
立刻开始写代码	先用 5 分钟确认需求
依赖 Claude 的默认假设	Claude 的决策基于你的实际需求
需要多轮修改才对	第一版基本就是你想要的
任务越复杂返工越多	任务越复杂，头脑风暴的价值越大
最终可能超出原始意图	严格控制在商定的范围内

提示

如何从头脑风暴中获得最大收益：

描述需求时加入研究背景——是学位论文章节、期刊投稿还是课程作业？这会影响输出的规范程度。
不要敷衍地回答”随便”——每一个问题都有正确答案，就算你现在不确定，也可以说”我倾向于 X，但你来推荐”。
如果 Claude 提的方案里没有你想要的，直接说出来，它会相应调整。
头脑风暴的结论会保存成一份设计文档（spec），你可以要求 Claude 把它输出给你存档。

5.3 其他实用技能

除头脑风暴外，Superpowers 还包含几个在研究场景中很有价值的技能。它们大多在后台自动触发，你不需要主动调用，但了解它们的存在有助于你理解 Claude Code 的行为。

5.3.1 任务拆解（Writing Plans）

头脑风暴结束后，Claude Code 会把整个任务分解成一系列小步骤，每步通常只需要 2–5 分钟完成。每一步都有明确的目标和验证标准：完成了、没完成、还是遇到了阻碍。

这种拆解方式的好处是透明且可恢复。你可以随时查看任务进度，任何一步出错只影响那一步，不会让整个分析重来。对于像”完整复制一篇论文的分析”这样涉及十几个子步骤的任务，任务拆解能把不可控的大问题变成可管理的小问题。

5.3.2 系统调试（Systematic Debugging）

当代码报错时，Superpowers 要求 Claude Code 先找到根本原因，再开始修改。听起来理所当然，但没有这个约束，AI 的本能反应往往是”先改掉眼前的报错信息”——结果是修了 A 破了 B，越改越乱。

这个技能对研究者特别有价值。比如你的回归系数突然变了——Claude Code 不会直接猜测原因就动手，而是先系统地追溯：是数据读取有问题？变量编码改变了？还是控制变量集发生了变化？找到真实原因后再修复，修一次就彻底解决。

5.3.3 验证完成（Verification）

这个技能只做一件事：拒绝没有证据的”完成”声明。

Claude Code 在完成任务后必须实际运行代码、查看输出、确认结果符合预期，才能告诉你”完成了”。它不能说”代码看起来没问题”或”应该可以”——必须有实际运行的证据。

对研究者来说，这意味着你收到的每一份分析结果背后，都有一次实际的验证运行，而不只是”我觉得没问题”的判断。

5.3.4 代码审查（Code Review）

在完成一个较大的任务块后，Superpowers 会自动触发代码审查，检查代码的质量和正确性。审查会关注：

统计方法是否符合你在头脑风暴中确认的方案
变量定义和 CLAUDE.md 中的规范是否一致
有没有可能导致可重复性问题的硬编码路径或随机种子遗漏
代码是否整洁、易于将来维护

注释

代码审查结果会直接呈现给你。如果审查发现了问题，Claude Code 会修复后再汇报——你看到的是”审查通过后的最终版本”，不是”审查前的初稿”。

5.4 一次完整的工作流

以一个具体任务为例，看看 Superpowers 是如何在幕后推动整个过程的：

我想分析 CGSS 2021 数据中社会信任对社区参与的影响，
用 OLS 做基础估计，再讨论一下可能的机制。
输出一张回归表和一张机制路径图，放进我的硕士论文。

你输入这段话后，发生了什么：

头脑风暴启动（5–8 分钟） Claude Code 询问社会信任如何测量（单题量表 vs. 综合指数）、社区参与的操作化定义、控制变量范围、机制变量是否已有数据。你一一回答，双方确认使用五题综合信任指数、三类参与行为、标准人口学变量，机制分析先做中介检验。
任务拆解（自动，通常在后台） Claude Code 生成一份任务清单：读取并检查数据 → 构建综合指数 → 三个基础回归模型 → 输出回归表 → 中介分析 → 绘制路径图。
逐步执行 + 验证 每完成一步，Claude Code 运行代码验证结果，记录检查点。如果某步失败，它先找根本原因再修复，而不是反复猜测。
代码审查 + 验证完成 全部步骤完成后，自动审查代码质量，确认输出文件存在且格式正确，才告诉你任务完成。

你在整个过程中做的事：回答了头脑风暴的 5 个问题（约 5 分钟），然后等待结果。

5.5 什么时候值得用，什么时候不必用

Superpowers 不是每次对话都需要的。下面这张表帮你判断：

任务类型	是否值得	原因
完整的分析项目（多个模型 + 输出）	非常值得	头脑风暴能防止大量返工
不熟悉的方法（分位数回归、空间分析……）	非常值得	头脑风暴帮你确认方法选择
团队共享的代码	非常值得	审查和文档质量更高
需要复现他人分析	值得	任务拆解让进度可追踪
快速查看一个变量的分布	不必要	简单任务直接问就好
修改一处注释或变量名	不必要	头脑风暴开销大于收益
临时性的数据探索	视情况	短期任务酌情判断

提示

刚开始时的建议：选一个你近期要做的真实分析任务（比如一套描述性统计 + 基础回归），完整走一遍 Superpowers 工作流。这比看任何介绍都更有说服力——你会直接感受到头脑风暴把你从”重做三遍”中解救出来的体验。

子代理机制是 Superpowers 工作流中执行阶段的底层支撑——如果你对子代理如何工作感兴趣，可以参见章节 9.1 的详细介绍。