图片分析与识别,可分析本地图片、网络图片、视频、文件。适用于 OCR、物体识别、场景理解等。当用户发送图片或要求分析图片时必须使用此技能。
Doubao (Volcengine ARK) API Shell 脚本实现 - 文本生图、图片编辑和文本生视频,接口文档https://www.volcengine.com/docs/82379/1520757?lang=zh#y2hhTyHB
调用 Nano Banana API 生成或编辑图片,支持文生图和图生图,需提供API Key和提示词,支持自定义尺寸比例。
通过Nano Banana API完成文本生成图像和图像编辑,支持上传图片和自定义尺寸比例的生图测试和联调。
将任意主题、长文、报告、纪要或说明文本稳定转换成中文视觉生图提示词, 然后调用 DashScope Qwen 图像模型直接出图。适用于“把这段内容做成信息图
使用淘宝进行以图搜同款、候选比对和加购物车操作。用户提供商品图片并要求“搜同款/找类似款/比价/加入购物车”时使用。优先执行本地脚本(save-
使用 MiniMax MCP 进行图像理解和分析。触发条件:(1) 用户要求分析图片、理解图像、描述图片内容 (2) 需要识别图片中的物体、文字、场景 (3) 使用 MiniMax
Pixshop CLI 命令行工具 — AI 图片/视频生成、编辑工具、应用市场、提示词库 / Pixshop CLI — command-line AI image/video generation, editing tools, apps, prompts. Use when user wants to ge...
将 Markdown 表格转换为清晰图片。当用户说"表格看不清"、"生成图片"、"转成图片"时触发。
Automatically back up images to stardots.io cloud storage with secure MD5 authentication and configurable credentials.
Automatically upload images to Stardots.io cloud storage, manage files, and obtain secure access links using API authentication.
将多张图片自动旋转合并为单个PDF,支持根据Excel清单重命名及扫描PDF的OCR文字提取。
使用智谱AI的GLM-4V-Flash免费多模态API理解图片内容。当用户需要理解图片内容、描述图片、识别图中物体时使用此skill。
将PDF文件的每一页转换为图片文件;支持自定义图片格式(PNG/JPG)和分辨率;适用于文档处理、图片化存档等场景
使用火山引擎豆包模型生成图片。通过火山引擎豆包图片生成 API 创建图片。支持自定义提示词、尺寸、模型等参数。使用方式:生图:一只可爱的小猫
文章配图推荐。根据文章主题、内容关键词,推荐合适的配图来源和搜索关键词,帮助用户找到符合文章意境的图片。当用户提到「配图」「找图」「
图片尺寸调整和压缩工具技能。用于按指定像素宽高、比例或最大尺寸限制调整图片大小,并支持智能压缩到指定文件大小。适用于需要批量处理图片
Generate ecommerce-ready visual assets (cover, comparison card, infographic, product explainer) from a product brief. Use when teams need fast visual product...
生成配图、封面图、卡片图、文字海报、公众号文章封面图、微信公众号头图、X 风格帖子分享图、帖子长图、社媒帖子长图。适用于帖子类型数据、pos
智谱 GLM-4.6V 多模态视觉模型集成插件。支持 128K 长上下文、文档解析、视频理解与原生工具调用。具备工业级安全审计指引。
图片生成技能,当用户需要生成图片、视觉信息图、创建图像、编辑/修改/调整已有图片时使用此技能。基于中国的API易代理站(https://apiyi.com/)的NanoBanana
统一图片内容提取技能。智能识别终端/文档/通用模式,自动提取内容生成Markdown。
图片批量压缩和格式转换工具,支持批量调整大小、压缩质量、转换格式,预览模式和撤销功能!