🧪 Skills
Image Generator
Generate images via BigModel APIs and send them as chat images (e.g. Feishu). Invoke when user asks to create a single picture with specific style/size.
v1.0.0
Description
name: image-generator description: Generate images via BigModel APIs and send them as chat images (e.g. Feishu). Invoke when user asks to create a single picture with specific style/size. metadata: { "openclaw": { "emoji": "🖼️", "requires": { "env": ["ZHIPU_API_KEY"] }, "primaryEnv": "ZHIPU_API_KEY" } }
CogView-3-Flash Skill
基于智谱/BigModel 的 cogview-3-flash 文生图接口,提供快速单张图片生成能力。
Features
- 使用
https://open.bigmodel.cn/api/paas/v4/images/generations接口 - 支持通过环境变量
ZHIPU_API_KEY配置鉴权 Token - 支持
cogview-3-flash与glm-image两类模型 - 作为 OpenClaw Skill 使用:当用户在对话中请求生成图片时,由 Agent 调用本技能,自动执行
scripts/generate.py,根据提示词和尺寸生成图片并返回本地文件路径 - 简单参数:提示词、尺寸、水印开关
Setup
- 从对应平台控制台获取 API Key/Token
- 在终端中设置环境变量:
export ZHIPU_API_KEY="你的 API Key"
或在工具配置中以同名变量注入。
Models & Sizes
在脚本中通过 --model 选择模型:
cogview:对应cogview-3-flash(默认)glm:对应glm-image
各模型推荐尺寸与限制:
glm-image推荐枚举值:1280x1280(默认),1568x1056,1056x1568,1472x1088,1088x1472,1728x960,960x1728
自定义尺寸: 长宽推荐在1024px-2048px范围内, 最大像素数不超过2^22,长宽需为32的整数倍。- 其它模型(如
cogview-3-flash)推荐枚举值:1024x1024(默认),768x1344,864x1152,1344x768,1152x864,1440x720,720x1440
自定义尺寸: 长宽需在512px-2048px范围内, 最大像素数不超过2^21,长宽需为16的整数倍。
Usage
命令行生成图片
python scripts/generate.py \
"两只可爱的小猫咪,坐在阳光明媚的窗台上,背景是蓝天白云。" \
--model cogview \
--size 1024x1024 \
--no-watermark \
--output cats.png
参数说明
prompt:必填,中文或英文提示词--model:模型选择,cogview(默认)/glm--size:图片尺寸,不传则使用所选模型默认尺寸--watermark:开启水印(默认开启)--no-watermark:关闭水印--output/-o:指定输出文件名,默认自动生成
API 行为说明
- 接口返回 JSON,格式类似:
{
"created": 1773146620,
"data": [
{ "url": "https://.../image.png" }
],
"id": "20260310204340ad2bd838dcb64c7f",
"request_id": "20260310204340ad2bd838dcb64c7f"
}
- 本 Skill 会自动解析
data[0].url,下载图片并保存到本地。
在 Feishu 中的使用(给 Agent 的操作指引)
当用户在 Feishu 对话中请求你生成图片时,请按下面步骤操作:
-
使用系统运行工具,在
{baseDir}目录下执行命令,根据用户的提示词和期望尺寸构造参数,例如:python {baseDir}/scripts/generate.py "<用户提示词>" --model cogview --size "<宽x高>" --no-watermark --output "/root/.openclaw/workspace/images/cogview-{时间戳}.png"
-
从脚本标准输出中找到形如
✅ 图片已保存: /path/to/image.png的一行,并解析出其中的本地图片路径。 -
使用 Feishu 的发送图片能力,将该图片文件直接作为图片消息发送到当前会话,而不是只把本地路径文本返回给用户。
-
在文字回复中简单说明图片信息(模型、尺寸、提示词等),同时附上生成的图片。
示例
# 使用 cogview-3-flash,默认尺寸
python scripts/generate.py "一幅赛博朋克城市夜景,霓虹灯与雨夜" -o cyberpunk.png
# 使用 glm-image,自定义尺寸 + 关闭水印
python scripts/generate.py \
"可爱风格的猫咪插画" \
--model glm \
--size 1280x1280 \
--no-watermark
Reviews (0)
Sign in to write a review.
No reviews yet. Be the first to review!
Comments (0)
No comments yet. Be the first to share your thoughts!