Skip to main content
ClaudeWave
Skill630 estrellas del repoactualizado 3d ago

seedream

Seedream is a Claude Code skill that generates high-quality AI images using Volcengine's Seedream model. It supports multiple creation modes including text-to-image generation, image editing, multi-image fusion, and web-search-based generation. Use this skill when users request image creation, manipulation, or editing based on text descriptions or existing images.

Instalar en Claude Code
Copiar
git clone --depth 1 https://github.com/freestylefly/wesight /tmp/seedream && cp -r /tmp/seedream/SKILLs/seedream ~/.claude/skills/seedream
Después abre una sesión nueva de Claude Code; el skill carga automáticamente.

SKILL.md

# Seedream 图片生成

使用火山引擎 Seedream 模型生成高质量 AI 图片,支持文本生成图片(T2I)、图片编辑(I2I)、多图融合、组图生成、联网搜索等多种创作模式。

> ✨ **Node.js 版本**:此脚本使用 Node.js 实现,无需 Python 环境。通过入口脚本自动检测 Node.js 运行时(优先使用系统 node,回退到 WeSight 内置运行时),Windows 和 Mac 用户都可以开箱即用。

## 配置

- **Base URL**: `https://ark.cn-beijing.volces.com/api/v3`
- **API Key**: 从环境变量 `ARK_API_KEY` 读取
- **认证方式**: `Authorization: Bearer {API_KEY}`
- **SDK**: 兼容火山方舟 Python SDK

### 快速开始

**第一步:设置 API Key**

```bash
# macOS / Linux - 当前终端临时生效(立即使用)
export ARK_API_KEY="你的API密钥"

# Windows PowerShell - 当前会话临时生效
$env:ARK_API_KEY="你的API密钥"

# 验证设置成功(macOS/Linux)
echo $ARK_API_KEY

# 验证设置成功(Windows)
echo $env:ARK_API_KEY
```

**第二步:生成你的第一张图片**

```bash
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "一只可爱的橘色小猫"
```

### 如何配置 API Key

**方式一:通过环境变量配置(推荐)**

在终端中设置环境变量:

```bash
# macOS/Linux
export ARK_API_KEY="你的API密钥"

# 或者添加到 ~/.zshrc 或 ~/.bashrc 以永久生效
echo 'export ARK_API_KEY="你的API密钥"' >> ~/.zshrc
source ~/.zshrc
```

```powershell
# Windows PowerShell
$env:ARK_API_KEY="你的API密钥"

# 或者设置系统环境变量以永久生效
[System.Environment]::SetEnvironmentVariable('ARK_API_KEY', '你的API密钥', 'User')
```

**方式二:通过 WeSight 启动时注入**

WeSight 会自动读取系统环境变量,确保在启动 WeSight 前已设置 `ARK_API_KEY`。

**如何获取 API Key:**
1. 访问火山方舟控制台:https://console.volcengine.com/ark/region:ark+cn-beijing/apikey
2. 创建新的 API Key
3. 复制密钥并设置为环境变量

## 前置检查

**无需安装任何依赖!** 该脚本已兼容 Node.js 内置模块。

WeSight 已包含 Node.js 运行时,所有必要的依赖已被自动打包。Windows 和 Mac 用户无需额外配置。

## 工作流程

Seedream 图片生成采用**同步模式**,流程简单高效:

1. **提交请求** - 调用 API 提交图片生成请求
2. **等待生成** - API 直接处理并生成图片(通常 30-60 秒)
3. **下载图片** - 从返回的 URL 下载生成的图片文件

相比异步模式,同步模式更简单直接,无需轮询任务状态。

## 配额和限制

### 免费额度

所有 Seedream 模型提供免费额度,具体请参见火山方舟控制台。

### 限流限制

- **IPM(每分钟图片数)**: 500 张/分钟(Seedream 4.5, 4.0)
- 不同模型的限流不同,请参见官方文档

### 图片保存时间

⚠️ **重要提醒**:
- 任务数据(包括图片URL)仅保留 **24 小时**
- 超时后会被自动清除
- **务必及时下载保存生成的图片**

## 使用示例

**路径说明**:下面的示例使用 `$SKILLS_ROOT` 环境变量来引用脚本路径。WeSight 会自动设置这个变量,指向实际的 SKILLs 目录位置,因此无需手动修改路径。

### 1. 文本生成图片(T2I)

根据文字描述生成图片,适合创意激发和概念设计。

```bash
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "充满活力的特写编辑肖像,模特眼神犀利,头戴雕塑感帽子,色彩拼接丰富,景深较浅,Vogue杂志封面美学风格" \
  --output portrait.png
```

**示例提示词:**
- "写实风格,晴朗的蓝天之下,一大片白色的雏菊花田,镜头逐渐拉近,最终定格在一朵雏菊花的特写上"
- "卡通风格,一只橘色小猫坐在窗台上,阳光洒在身上,温暖治愈的氛围"
- "赛博朋克风格,未来城市夜景,霓虹灯闪烁,高楼林立"

### 2. 图片编辑(I2I)- 单图输入

基于已有图片,结合文字指令进行图像编辑。**支持本地图片和网络URL**。

```bash
# 使用本地图片
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "保持模特姿势不变,将服装材质改为透明玻璃质感" \
  --image "/Users/yourname/Pictures/model.jpg" \
  --output edited_model.png

# 使用网络图片
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "将背景改为海边日落场景" \
  --image "https://example.com/photo.jpg" \
  --output beach_sunset.png
```

**支持的图片来源:**
- ✅ 本地文件:`/path/to/image.jpg`
- ✅ 网络URL:`https://example.com/image.jpg`
- ✅ file://协议:`file:///path/to/image.jpg`

**支持的图片格式:**
- jpg, jpeg, png, gif, webp, bmp, tiff, heic

### 3. 多图融合(多图输入单图输出)

融合多张参考图的特征生成新图像。**支持混合使用本地图片和网络图片**。

```bash
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "将图1的服装换为图2的服装" \
  --image "/Users/yourname/Pictures/person.jpg" \
  --image "https://example.com/clothes.jpg" \
  --output fusion_result.png
```

**常见使用场景:**
- 服装试穿:人物图 + 服装图 → 穿搭效果图
- 风格迁移:照片 + 风格参考图 → 风格化作品
- 场景融合:人物 + 背景 → 合成场景

### 4. 组图生成(多图输出)

生成一组内容关联的图片,适合漫画分镜、品牌视觉等。

#### 文生组图

```bash
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "生成一组共4张连贯插画,核心为同一庭院一角的四季变迁,以统一风格展现四季独特色彩、元素与氛围" \
  --sequential \
  --max-images 4 \
  --output seasons.png
```

输出文件会自动编号:`seasons_1.png`, `seasons_2.png`, `seasons_3.png`, `seasons_4.png`

#### 单图生组图

```bash
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "参考这个LOGO,做一套户外运动品牌视觉设计,品牌名称为'GREEN',包括包装袋、帽子、卡片、挂绳等" \
  --image "/Users/yourname/Pictures/logo.png" \
  --sequential \
  --max-images 4 \
  --output brand_design.png
```

### 5. 联网搜索增强生成(Seedream 5.0 lite)

启用实时网络搜索,融合最新网络信息。

```bash
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
  --prompt "搜索下近期热门的白鸭子单手拿着风车形象,以极具冲击力的视角,设计成巨型装置" \
  --search \
  --output search_result.png
```

**注意**:
- 联网搜索功能仅限 Seedream 5.0 lite 模型
- 使用 `--search` 参数会自动切换到 5.0 lite 模型
- 适合需要融合实时信息的创作场景

## 参数说明

### 必需参数

| 参数 | 说明 | 示例 |
|-----|------|------|
| `--prompt` | 图片描述提示词(必需) | "一只可爱的小猫" |

### 可选参数

| 参数 | 说明 | 默认值 | 可选值 |
|-----|------|-------|--------|
| `--image` | 参考图片路径或URL(可多次使用) | 无 | 本地文件路径或URL |
| `--model` | 模型ID | `doubao-seedream-4-5-251128` | 见模型列表 |
| `--size` | 图片尺寸 | `2K` | `1K`, `2K`, `4K` |
| `--no-watermark` | 不添加水印 | 否 | 标志参数 |
| `--sequential` | 生成组图 | 否 | 标志参数 |
| `--max-images` | 组图数量 | 4 | 1-8 |
| `--search` | 启用联网搜索 | 否 | 标志参数 |
| `--output` | 输出文件路径 | `generated_image.png` | 文件路径 |
| `--poll-interval` | 状态查询间隔(秒) | 5 | 1-10 |
| `--timeout` | 最大等待时间(秒) | 300 | 60-600 |

## 模型选择

选择合适的模型以平衡质量、速度和成本:

### Seedream 4.5(推荐)

- **模型ID**: `doubao-seedream-4-5-251128`
- **特点**: 最新版本,综合质量最佳
- **支持**: 文生图、图生图、多图融合、组图生成
- **输出**: 1K-4K分辨率可选
- **限流**: IPM 500

### Seedream 4.0

- **模型ID**: `doubao-seedream-4-0-250828`
- **特点**: 成熟稳定版本
- **支持**: 文生图、图生图、多图融合、组图生成
- **输出**: 1K-4K分辨率可选
- **限流**: IPM 500

### Seedream 5.0 lite(联网搜索专用)

- **模型ID**: `doubao-seedream-5-0-260128`
- **特点**: 支持联网搜索,融合实时网络信息
- **使用**: 通过 `--search` 参数自动启用
- **注意**: 2026年2月24日18点后正式开放 API

**推荐使用场景:**
- 追求最高质量 → 4.5
- 稳定生产环境 → 4.0
- 需要实时信息 → 5.0 lite(使用 `--search`)

## 高级选项

### 自定义图片尺寸

根据使用场景选择合适的尺寸:

```bash
# 小尺寸(快速预览)
--size "1K"

# 标准尺寸(推荐)
--size "2K"

# 高清晰度
--size "4K"
```

**注意:**
- 尺寸越大,生成时间越长
- 4K 图片可能需要 40-60 秒

### 去除水印

生成无水印图片(用于商业用途):

```bash
--no-watermark
```

### 轮询和超时控制

调整轮询策略以适应不同场景:

```bash
# 快速查询(适合小图)
--poll-interval 3 --timeout 180

# 标准配置
--poll-interval 5 --timeout 300

# 耐心等待(适合4K或组图)
--poll-interval 10 --timeout 600
```

## 状态说明

生成过程中可能出现的任务状态:

| 状态 | 说明 | 操作 |
|------|------|------|
| `queued` | 任务排队中 | 继续等待 |
| `running` | 正在生成图片 | 继续等待 |
| `succeeded` | 生成成功 | 下载图片 |
| `failed` | 生成失败 | 查看错误信息 |

## 错误处理

### 常见错误及解决方案

**错误:未设置环境变量 ARK_API_KEY**
- 原因:未配置 API Key