Skip to main content
ClaudeWave
Skill1.5k estrellas del repoactualizado yesterday

video-recreation

The video-recreation Claude Code skill provides an end-to-end workflow for video content remixing, encompassing video analysis through frame extraction and visual interpretation via Coze Bot API, followed by asset generation including images, sound effects, background music, voiceovers using Edge-TTS, and subtitles. Use this skill when users request video remixing, reverse-engineering, recreation, or creating new content based on reference videos, as it orchestrates the complete pipeline from analyzing source material to synthesizing and downloading final video output.

Instalar en Claude Code
Copiar
git clone --depth 1 https://github.com/anbeime/skill /tmp/video-recreation && cp -r /tmp/video-recreation/skills/video-recreation/video-recreation ~/.claude/skills/video-recreation
Después abre una sesión nueva de Claude Code; el skill carga automáticamente.

SKILL.md

# video-recreation

## 任务目标
- 本Skill用于:视频二创创作,从原视频反推分析到新视频合成的完整流程
- 能力包含:视频分析、素材生成(图片/音频/配音/字幕)、视频合成、文件下载
- 触发条件:用户要求"二创视频"、"反推视频"、"视频重制"、"根据参考视频创作"等

## 前置准备
- 环境依赖:
  ```
  opencv-python>=4.8.0
  pillow>=10.0.0
  moviepy>=1.0.3
  numpy>=1.24.0
  requests>=2.28.0
  edge-tts>=6.1.0
  ```
- Edge-TTS安装:
  ```bash
  pip install edge-tts
  ```
- Suno API(可选):
  - 用于生成真实的背景音乐
  - 三种配置方式:
    1. **开发者模式**: 技能已预置 API Key,开箱即用
    2. **用户模式**: 设置环境变量 `export SUNO_API_KEY=your_api_key`
    3. **命令行模式**: 执行时指定 `--suno-api-key your_api_key`
  - 配置优先级: 命令行参数 > 环境变量 > 技能凭证
  - 占位模式: 未配置 API Key 时自动使用占位实现
  - 官网: https://suno.com
- 环境变量:
  - `COZE_BOT_ID`: Coze Bot ID (默认: 7572557757883383858)
  - `COZE_API_KEY`: Coze API Key (需配置)
- 输出目录结构:
  ```
  ./output/
    ├── frames/          # 视频关键帧
    ├── analysis.json    # 反推分析结果
    ├── images/          # 生成的图片素材
    ├── audio/           # 音效和背景音乐
    ├── voice/           # 配音音频
    ├── subtitles/       # 字幕文件
    └── final.mp4        # 最终合成视频
  ```

## 操作步骤

### 第一阶段:视频反推分析
1. **提取视频关键帧**
   - 调用 `scripts/video_frame_extractor.py` 提取关键帧
   - 参数: `--input <原视频路径> --output ./output/frames --interval 2`
   - 输出:序列图片到 `./output/frames/`

2. **视觉分析**
   - 调用 `scripts/coze_bot_client.py` 分析关键帧
   - 智能体描述分析需求:"分析这些视频帧,提取:1.画面风格 2.色调特征 3.构图方式 4.节奏模式"
   - 参数: `--message "<分析提示>" --image_path <关键帧路径>`
   - 输出:分析结果保存到 `./output/analysis.json`

3. **生成创作方案**
   - 智能体根据分析结果,生成二创方案:
     - 新视频主题
     - 画面风格调整
     - 脚本大纲
     - 素材需求清单

### 第二阶段:素材生成
4. **生成图片素材**
   - 智能体根据脚本生成关键帧提示词
   - 调用 `scripts/image_generator.py` 生成图片
   - 参数: `--prompt "<提示词>" --output ./output/images/frame_xxxx.png`
   - **重要**:图像生成应由智能体创作,脚本仅负责技术实现
   - 输出:图片到 `./output/images/`

5. **生成音效和背景音乐**
   - 智能体描述音效需求:"根据场景生成音效:1.转场音效 2.背景音乐风格 3.环境音"
   - 调用 `scripts/sound_generator.py` 生成音效和背景音乐
   - 参数: `--type sound --input <音效配置JSON> --output ./output/audio` (生成音效)
   - 参数: `--type music --input <音乐配置JSON> --output ./output/audio` (生成背景音乐)
   - 参数: `--type both --input <完整配置JSON> --output ./output/audio` (同时生成两者)
   - **API Key 配置**(可选):
     - 不配置: 自动使用占位实现(开箱即用,无需任何配置)
     - 环境变量: `export SUNO_API_KEY=your_api_key`
     - 命令行参数: `--suno-api-key your_api_key`
     - 强制占位: `--use-placeholder` (即使有 API Key 也使用占位)
   - 输出:音效到 `./output/audio/sound_effects/`, 背景音乐到 `./output/audio/background_music/`
   - **模式说明**:
     - **开发者模式**: 技能已预置 API Key,直接使用
     - **用户模式**: 用户自己配置 API Key
     - **占位模式**: 未配置 API Key 时自动降级

6. **生成配音**
   - 智能体作为配音师,创作旁白脚本:
     - 分析原视频节奏
     - 创作贴合画面的旁白
     - 选择合适的音色(中文/英文/日文等20+音色)
     - 调整语速、音调、音量参数
   - 调用 `scripts/voice_generator.py` 合成配音(基于Edge-TTS)
   - 参数: `--input <旁白脚本JSON> --output ./output/voice`
   - 参数: `--list-voices` (列出所有可用音色)
   - 输出:配音文件到 `./output/voice/`
   - **音色示例**:
     - 中文女声: zh-CN-XiaoxiaoNeural(活泼)、zh-CN-XiaohanNeural(知性)、zh-CN-XiaomengNeural(温柔)
     - 中文男声: zh-CN-YunyangNeural(沉稳)、zh-CN-YunjianNeural(深沉)、zh-CN-YunxiNeural(活泼)
     - 英文女声: en-US-JennyNeural(美式)、en-GB-SoniaNeural(英式)

7. **生成字幕**
   - 智能体创作字幕内容,确保:
     - 文字简洁有力
     - 与画面同步
     - 符合视频节奏
   - 调用 `scripts/subtitle_generator.py` 生成字幕文件
   - 参数: `--input <字幕数据JSON> --output ./output/subtitles`
   - 输出:SRT字幕到 `./output/subtitles/`

### 第三阶段:视频合成
8. **合成最终视频**
   - 调用 `scripts/video_compositor.py` 合成视频
   - 参数: `--images ./output/images --audio ./output/audio --voice ./output/voice --subtitles ./output/subtitles --output ./output/final.mp4`
   - 输出:最终视频 `./output/final.mp4`

9. **文件下载**
   - 启动HTTP服务器供下载
   - 调用 `scripts/file_server.py`
   - 参数: `--port 8080 --directory ./output`
   - 输出:下载链接 `http://localhost:8080/final.mp4`

### 错误处理与断点续传
- **重试机制**:所有API调用已配置最大重试次数(2-3次),避免无限消耗Token
- **错误日志**:错误自动记录到 `./output/error_log.json`,可用于问题诊断
- **断点续传**:
  - 检查 `./output/error_log.json` 确认失败步骤
  - 从失败步骤重新执行,已生成的素材可复用
  - 例如:仅重新生成失败的音频,不重复已有图片
- **重试限制**:
  - Coze Bot API调用:最多重试3次,每次间隔1秒
  - 图像生成:最多重试2次,每次间隔0.5秒
  - 音频生成:最多重试2次,每次间隔0.5秒
  - 音效和背景音乐:最多重试2次,每次间隔0.5秒

## 资源索引
- **视频处理**:见 [scripts/video_frame_extractor.py](scripts/video_frame_extractor.py)(提取关键帧)
- **视觉分析**:见 [scripts/coze_bot_client.py](scripts/coze_bot_client.py)(调用Coze Bot API)
- **图像生成**:见 [scripts/image_generator.py](scripts/image_generator.py)(生成图片素材)
- **音频生成**:见 [scripts/audio_generator.py](scripts/audio_generator.py)(生成旁白/配音)
- **音效和音乐**:见 [scripts/sound_generator.py](scripts/sound_generator.py)(生成环境音效和背景音乐,集成Suno API)
- **配音合成**:见 [scripts/voice_generator.py](scripts/voice_generator.py)(合成旁白,基于Edge-TTS)
- **字幕生成**:见 [scripts/subtitle_generator.py](scripts/subtitle_generator.py)(生成字幕)
- **视频合成**:见 [scripts/video_compositor.py](scripts/video_compositor.py)(合成最终视频)
- **文件服务**:见 [scripts/file_server.py](scripts/file_server.py)(HTTP下载服务器)
- **错误处理**:见 [scripts/error_handler.py](scripts/error_handler.py)(重试和错误日志)
- **创作指南**:见 [references/recreation-guide.md](references/recreation-guide.md)(视频二创方法论)
- **提示词模板**:见 [references/prompt-templates.md](references/prompt-templates.md)(分析提示词示例)
- **Suno API指南**:见 [references/suno-api-guide.md](references/suno-api-guide.md)(Suno API使用说明)

## 注意事项
- **智能体职责**:内容创作(剧本、旁白、字幕、图像提示词)由智能体完成,脚本负责技术处理
- **重试限制**:避免无限重试消耗Token,已配置合理重试次数
- **错误日志**:遇到错误时检查 `./output/error_log.json`,从失败步骤恢复
- **断点续传**:重复执行时,已存在的素材会被复用,无需重新生成
- **Coze Bot API**:视觉分析依赖用户发布的Coze Bot,需配置API Key
- **文件路径**:所有输出使用相对路径 `./output/`,确保下载时能正确访问

## 使用示例

### 示例1:完整二创流程
```bash
# 1. 提取关键帧
python scripts/video_frame_extractor.py \
  --input original_video.mp4 \
  --output ./output/frames \
  --interval 2

# 2. 视觉分析(智能体描述分析需求)
python scripts/coze_bot_client.py \
  --message "分析这些视频帧,提取:画面风格、色调特征、构图方式、节奏模式" \
  --image_path ./output/frames/frame_0001.jpg

# 3. 生成图片素材(智能体创作提示词)
python scripts/image_generator.py \
  --prompt "现代科技风格,蓝色调,未来城市景观" \
  --output ./output/images/frame_0001.png

# 4. 生成音效和背景音乐

# 方式1: 使用技能预置的 API Key(开箱即用)
python scripts/sound_generator.py \
  --type both \
  --input audio_config.json \
  --output ./output/audio

# 方式2: 使用自己的 API Key
export SUNO_API_KEY=your_api_key
python scripts/sound_ge
xiaoyue-companionSkill

小跃虚拟伴侣 - 使用智谱 AI 提供温暖的对话陪伴和静态图片分享

companion-skillSkill
agent-teamSkill

统一管理多智能体角色的团队协作框架,支持智能体动态组合、灵活协作和扩展新角色。智能体本质上是"角色定义",可以根据任务需求灵活组建团队,实现从会议决策到系统构建的完整能力。智能体角色明确分工:有干活的、有指挥的、有挑毛病的,能实时看到沟通过程,共享数据库记忆,确保上下文一致。

agentkit-multimedia-shoppingSkill

基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程

article-illustratorSkill

分析文章内容,在需要视觉辅助理解的位置生成插画。配图可以是信息补充、概念具象化,或引导读者想象。当用户要求"给文章配图"、"为文章生成插图"、"添加配图"时使用此技能。

bedtime-storySkill

为3-12岁儿童提供温馨亲切的睡前寓言故事和成语典故讲解。支持用户唤醒后提供故事列表选择,或直接讲解指定故事/成语。讲解时保持亲切温馨的语气、0.6倍正常语速、通俗易懂的表达,为小朋友营造舒适的睡前氛围。

chrome-automationSkill

Connect to and control Google Chrome browser using agent-browser with CDP (Chrome DevTools Protocol). Use when the user wants to automate their existing Chrome browser, see browser actions in real-time, or needs to control the Chrome instance they're already using. Handles installation, setup, connecting via remote debugging, and all browser automation tasks with live visual feedback.

content-creation-publisherSkill

内容创作与发布全流程技能,整合网页采集、Markdown格式化、智能配图、多平台发布(微信公众号、X/Twitter)功能,实现从内容获取到发布的一站式解决方案