🧪 Skills
ime_message_skill
将输入法或语音输入系统已经识别出的口语文本,整理成适合即时通讯发送的自然书面语,并在用户明确指定目标语言时执行翻译。用于语音输入结束
v1.0.1
Description
name: ime-message-rewriter description: 将输入法或语音输入系统已经识别出的口语文本,整理成适合即时通讯发送的自然书面语,并在用户明确指定目标语言时执行翻译。用于语音输入结束后的文本润色、消息发送前整理、口语转消息文案、聊天文本优化等场景。输入应为文本而不是音频;当用户已经有 asr 结果、想让句子更顺、更干净、更适合发送时使用本技能。默认使用 doubao-seed-2-0-lite-260215,并通过可自行填写的 api token 调用模型服务。
输入法语音消息书面化
核心原则
- 将已经识别出的文本改成适合发送消息的自然书面语。
- 默认保留原意、语气和立场,只清理口语噪声。
- 默认不翻译;只有用户明确指定目标语言或明确要求翻译时才翻译。
- 输出应短、自然、可直接发送;不要改成公文、纪要、通知或长篇说明。
- 不要凭空补充事实,不要把犹豫语气改成确定结论。
- 默认模型为
doubao-seed-2-0-lite-260215。
输入要求
优先接收以下任一文本输入:
- 输入法语音识别结束后得到的一整段文本
- 输入框中已经插入的口语识别文本
- 用户粘贴的一小段口语化聊天文本
不要把本技能当作音频转写技能使用。若用户提供的是音频文件、音频 URL、base64 音频或要求直接做 ASR,请不要使用本技能的主流程。
默认处理流程
- 获取待处理文本。
- 判断用户是否要求翻译。
- 生成改写要求:
- 未要求翻译时,使用默认消息书面化指令。
- 要求翻译时,在默认消息书面化基础上补充目标语言要求。
- 运行
scripts/rewrite_client.py调用模型接口。 - 从返回结果中提取最终文本作为输出。
- 默认只返回最终文本;除非用户要求,否则不要展示接口原始 JSON。
默认改写指令
默认使用下面这条改写指令:
将口语输入整理成适合即时通讯发送的自然书面语,保留原意,去掉语气词和重复,不要过度正式。
如果用户提出更具体风格要求,可在此基础上追加:
- 更正式:
改成较正式但仍适合聊天发送的表达。 - 更口语:
保留轻松自然的聊天语气,但去掉明显口头禅和重复。 - 更简洁:
精简表达,保持关键信息完整。 - 翻译:
整理成自然书面语后翻译成 <目标语言>。
模型与鉴权
- 默认服务基地址:
https://models.audiozen.cn - 默认模型:
doubao-seed-2-0-lite-260215 api token不写入技能包;使用者自行通过环境变量填写。- 默认脚本按 OpenAI 兼容 Chat Completions 方式组装请求。
- 如果你的网关路径或字段与默认兼容格式不同,请修改
scripts/rewrite_client.py中的请求构造,或通过环境变量覆盖 endpoint。
输出要求
- 只输出最终可发送文本。
- 优先输出 1 段短文本;不要拆成分析说明。
- 保留原有意图,例如请求、解释、迟到说明、确认、婉拒、提醒。
- 对金额、时间、日期、数字保持自然规范写法。
- 如果原文极短且已经足够自然,可以只做极小修改。
不要这样做
- 不要改成会议纪要。
- 不要改成总结报告。
- 不要补充没有说过的信息。
- 不要把“可能、应该、想、先、再看看”改成绝对结论。
- 不要把聊天消息改得过于官腔。
示例
示例 1:迟到说明
输入:
嗯我这边可能晚十分钟到你们先开始吧
输出:
我这边可能会晚十分钟到,你们先开始吧。
示例 2:请求查看文件
输入:
我一会把那个文件发你你先帮我看一下
输出:
我一会儿把文件发给你,你先帮我看一下。
示例 3:带翻译要求
输入:
我今天可能来不及了明天给你
要求:翻译成英文
输出:
I might not make it today. I'll send it to you tomorrow.
接口与接入说明
- 模型接入细节见
references/api_cn.md - 产品接入建议见
references/integration_cn.md - 脚本入口见
scripts/rewrite_client.py
Reviews (0)
Sign in to write a review.
No reviews yet. Be the first to review!
Comments (0)
No comments yet. Be the first to share your thoughts!