Skill109 repo starsupdated 1mo ago

master-skill

# ClaudeWave: master-skill Master-skill is a framework for building industry-specific operating systems that encode how professionals in a field actually think, make decisions, and solve problems. It captures mental models, decision playbooks, communication patterns, quality standards, and anti-patterns for a defined subdomain (such as LLM agent infrastructure or cross-border e-commerce operations), then makes this operational knowledge accessible to people entering or serving that industry. Use it when you need to distill practical industry wisdom beyond surface-level information.

View source Repository: master-skill

Install in Claude Code

Copy

git clone https://github.com/swaylq/master-skill ~/.claude/skills/master-skill

Then start a new Claude Code session; the skill loads automatically.

Definition

SKILL.md

# 大师 · 行业蒸馏术

> 「同事.skill 蒸馏一个人，女娲.skill 蒸馏一种思维方式，大师.skill 蒸馏一整个行业的 OS。」

## 核心理念

一个好的行业 master skill **不是行业百科**，是**可运行的行业认知操作系统**：

- 这行的人用什么**心智模型**看问题？（镜片）
- 这行的标准**playbook** 是什么？（决策启发式）
- 这行的人怎么**沟通**？（行业表达 DNA）
- 什么算**好工作**？（质量基准）
- 外行才会犯什么错？（反模式）
- 这行的工具栈和工作流今年怎么变的？（时效层）

**关键区分**：捕捉的是 HOW the field thinks，不是 WHAT happens to be in the news this week。

---

## 范围约束（重要）

- **粒度**：一个 master skill 覆盖**一个细分领域**（例：「LLM agent 基础设施」「跨境电商运营」「足踝外科」），不要试图覆盖整个泛行业（「软件」「医疗」会让 OS 稀薄到没用）
- **目标用户**：行业内 / 想入行 / 服务这行的人。不是给完全外行做扫盲
- **不替代实操工具**：master skill 是「思维顾问」，不是 RPA。不要在里面塞「自动操作 X 后台」之类
- **版权安全**：不存全本书 / 完整字幕 / 长段原文。只保留结构化摘要 + 来源元数据 + 极短引用

---

## 路径占位符 (iter 24 重要)

prompts 里两个不同的目录占位符:

| 占位符 | 含义 | 例子 |
|--------|------|------|
| `{master_skill_dir}` | master-skill 仓库 (本仓库) 的 `skill/` 目录, 工具脚本住在这里 | `~/master-skill/skill/` 或 `/Users/foo/master-skill/skill/` |
| `{skill_dir}` | 当前正在生成 / 更新 的**行业** skill 目录, 调研笔记 / SKILL.md / sub-skills 都写到这里 | `~/.claude/skills/llm-agent-infra-master/` |

工具脚本 (source_verifier.py / cold_detector.py / quality_check.py / collectors / ingest / transcribe) **不复制**到生成的行业 skill 目录, agent 直接调 `{master_skill_dir}/tools/...`. 行业 skill 只装载 prompts + research notes + SKILL.md + sub-skills + cli/.

如果运行环境的 master-skill 路径变了, agent 替换占位符即可; 不需要改任何工具源代码.

---

## 执行流程

### Phase 0: 入口分流

收到用户输入后判断路径：

| 用户输入 | 路径 | 示例 |
|---------|------|------|
| 明确的细分行业 | **直接路径** → Phase 0A | 「我做跨境电商，给我做一个 master skill」 |
| 模糊的需求 | **诊断路径** → Phase 0B | 「我想转 AI 行业，但不知道哪个细分」 |
| 已存在的 skill | **更新路径** → Phase 0C | 「update 大师 LLM-agent-infra」 |

---

### Phase 0A: 行业澄清（直接路径）

确认 6 个维度（用户没主动提的字段就问，主动给的就不要重问）：

1. **行业 / 细分领域**（必填）— 例：`LLM agent infra`，不是 `AI`；`跨境电商运营`，不是 `电商`
2. **聚焦方向**（可选）— 全景画像 vs 某个角度优先（例：技术视角 vs 商业视角）
3. **地域 / 语言区**（可选）— global / 中文圈 / 美国 / 欧洲。影响信源选择
4. **用户身份**（可选）— 从业者 / 学习者 / 投资人 / 咨询。影响 master skill 的语气与决策视角
5. **本地素材**（强烈推荐询问）— 「你手上有这行的一手素材吗？行业报告 PDF / 内部文档 / 你写过的文章 / 长访谈 transcript / 视频字幕？有的话直接丢给我，比网上搜到的二手转述质量高得多」
6. **新建 or 更新**（可选）— 检查 `~/.claude/skills/{slug}-master/` 是否已存在

用户没主动给 → 默认全景 + global + 从业者视角 + 无本地素材，确认后推进。
用户提供了本地素材 → 标记为**本地语料模式**，Phase 1 采集策略相应调整。

确认后 → Phase 0.5。

---

### Phase 0B: 需求诊断（模糊路径）

用户不确定要蒸哪个细分时，反推合适的范围。

#### Step 1: 锚定核心目标

最多 1-2 轮追问，定位用户真正的需求维度：

| 维度 | 典型表达 | 反推方向 |
|------|---------|---------|
| 谋生 / 转行 | 「想入行 X」「做这个能赚钱吗」 | 商业生态视角的 master skill |
| 提效 | 「这行的工作流我搞不清」「文档堆成山」 | 工作流视角的 master skill |
| 决策 | 「不知道该选 A 还是 B」 | 工具选型 + 标准 playbook |
| 学习 | 「想系统学这行」 | 知识正典视角 |
| 创业 | 「想做 X 方向的产品」 | 行业 OS + 信息源（找未被满足的需求） |

#### Step 2: 反推候选

基于用户表达，提议 2-3 个具体的细分领域。每个候选要回答：

- 这个细分**目前真有可调研的公开材料吗**？（冷门领域的 master skill 质量必差）
- 它跟用户的需求多对齐？
- 它跟其他候选的差异在哪？

用户选定后 → Phase 0A 补全 6 个维度 → Phase 0.5。

---

### Phase 0C: 更新路径

读取已存在的 `{slug}-master/SKILL.md`，从 frontmatter 找到 `last_research_date`。基于距今多久决定刷新强度：

| 距今 | 刷新策略 |
|------|---------|
| < 1 月 | 拒绝刷新，告知用户最近刚更新过 |
| 1-3 月 | 仅 Track B（工具）+ Track C（工作流）+ Track E 中的「最新动态」节 |
| 3-6 月 | 加上 Track A（看 top figures 是否有大动作）+ Track F（标准是否有新版） |
| > 6 月 | 全部 6 轨重跑，但保留旧版 archive |

不要每次都重写整个 skill — 行业的**核心 OS** 通常 1-2 年才动一次，**工具 / 工作流**才是高频变量。

---

### Phase 0.5: 创建 Skill 目录

在调研开始之前完成：

```
{HOST_SKILLS_ROOT}/{slug}-master/
├── SKILL.md                          # 最终产物
├── meta.json                         # 元数据 (industry, locale, profile, last_research_date, source_count)
├── scripts/                          # 工具脚本（继承自 master-skill 仓库 + 行业特化）
└── references/
    ├── research/                     # 6 轨调研结果（必存）
    │   ├── 01-figures.md             # 行业大佬
    │   ├── 02-tools.md               # 工具地图
    │   ├── 03-workflows.md           # 工作流 / SOP
    │   ├── 04-canon.md               # 知识正典（书 / 论文 / 课）
    │   ├── 05-sources.md             # 信息源（newsletter / podcast / 会议 / 社区）
    │   └── 06-glossary.md            # 术语 + 标准 + 法规
    ├── synthesis.md                  # Phase 2 提炼结果（行业 OS）
    └── sources/                      # 一手素材（用户提供 + 网络下载的字幕等）
        ├── books/
        ├── transcripts/
        └── articles/
```

**HOST_SKILLS_ROOT 解析**：
- Claude Code: `~/.claude/skills`
- OpenClaw: `~/.openclaw/skills`
- Codex: `~/.codex/skills`
- Hermes: `~/.hermes/skills`
- 其他 / 不确定：在当前 cwd 下创建 `./{slug}-master/`，最后让用户决定装到哪

**目录创建后立即检查**：
- [ ] 目录已创建
- [ ] 如果 locale 是中文圈：信源策略切换为 B 站原始视频 / 小宇宙播客 / 36氪 / 极客公园 / 晚点 / 财新优先（**永远排除知乎、微信公众号、百度百科**）
- [ ] 如果 locale 是英文圈：默认 Twitter/X / YouTube / Substack / arXiv / 行业 podcast 优先
- [ ] 如果是更新模式：已读取现有 `SKILL.md` 和 `references/research/*.md`，标注哪些信息要刷
- [ ] 如果用户提供了本地素材：复制到 `sources/` 对应子目录，标记为**本地语料模式**

**关键规则（开源分发的核心）**：
- 所有调研文件必须存在 skill 目录内部 `references/research/`，**绝不存到外部目录**
- skill 必须自包含：clone 整个目录就能用
- 每个 subagent 必须把调研写入对应文件。不存文件的调研等于没做

---

### Phase 1: 多源信息采集（六轨 Agent Swarm，wave 结构）

#### 模式判断

| 模式 | 触发 | 策略 |
|------|------|------|
| **纯网络搜索**（默认） | 用户没给本地素材 | 6 个 Agent 全部走网络 |
| **本地语料优先** | 用户提供了 PDF / 行业报告 / transcript | 先按 6 轨分类本地素材，识别缺口，定向网络补充 |
| **纯本地语料** | 用户明确说「只用我给的」 | 只分析本地，不联网 |

#### Wave 结构（重要 — 不是纯并行）

iter 4 figures 跑通后发现：6 轨之间互相是 bootstrap 输入。Track 01 (figures) 的「最大几家公司创始人」依赖 Track 02 (tools) 找到的「关键工具」；Track 02 的「业内人吐槽过哪些工具」反过来依赖 Track 01 找到的人。强行纯并行 → 各轨都凭空猜起点。

执行结构：

**Wave 1（并行）— 「广撒网」轨**：
- Track 04 (canon) — 必读书 / 论文 / 课，搜索路径最独立（看 Goodreads / arXiv / 大学课程页就行）
- Track 05 (sources) — newsletter / podcast / 会议，搜索路径独立（搜「{industry} podcast」「{industry} newsletter」）
- Track 06 (glossary) — 术语 + 标准，从行业入门书 / 维基 / 标准化机构 page 抓

**Wave 1 加速器：先跑 collectors 拉机械 seed (iter 24)**

Wave 1 启动前 2 分钟跑这 4 个 collector, 拉到结构化 seeds.jsonl, 让 web search 不再凭空猜:

```bash
mkdir -p {skill_dir}/references/research/seeds
# 用户主 industry slug 对应的 GitHub topic / arXiv 类目 / 行业核心 RSS
python3 {master_skill_dir}/tools/collectors/github_topics.py --topic {topic} \
  --limit 30 --output {skill_dir}/references/research/seeds/github_repos.jsonl
python3 {master_skill_dir}/tools/collectors/arxiv_collect.py --query "cat:cs.AI AND all:agent" \
  --max 30 --output {skill_dir}/references/research/seeds/arxiv_papers.jsonl
python3 {master_skill_dir}/tools/collectors/rss_collect