🧪 Skills
Voice Note Transcriber Cn
语音笔记转文字工具 v2.1 | Voice Note Transcriber. 支持多语言识别、实时转写、说话人识别、智能摘要、音频降噪、离线识别。触发词:转写、识别、语音。
v1.1.0
Description
name: voice-note-transcriber-cn version: 1.1.0 description: "语音笔记转文字工具 v2.1 | Voice Note Transcriber. 支持多语言识别、实时转写、说话人识别、智能摘要、音频降噪、离线识别。触发词:转写、识别、语音。" author: 赚钱小能手 metadata: clawhub: emoji: 🎤 requires: bins: [ffmpeg, whisper]
语音笔记转文字工具 v2.1 🎤
智能语音识别,支持实时转写、多语言识别、说话人识别、会议纪要自动生成、音频降噪、离线识别。
🎯 核心功能
✨ v1.1新增功能
- 🌍 多语言识别 - 支持50+语言识别
- ⚡ 实时转写 - 边说边转文字
- 👥 说话人识别 - 多人对话自动区分
- 📝 智能摘要 - 自动生成摘要和重点
- 🔇 音频降噪 - 自动去除背景噪音
- 💾 离线识别 - 无网络也能使用
🎤 原有功能
- 🎙️ 语音转文字
- 📄 会议纪要生成
- 📊 转写准确率统计
🌍 多语言识别功能
支持的语言
| 语言 | 代码 | 准确率 | 特点 |
|---|---|---|---|
| 中文(简体) | zh-CN | 98% | 支持方言 |
| 中文(繁体) | zh-TW | 97% | 台湾用语 |
| 英语(美式) | en-US | 99% | 口音适应 |
| 英语(英式) | en-GB | 99% | 英式表达 |
| 日语 | ja | 96% | 敬语识别 |
| 韩语 | ko | 95% | 敬语识别 |
| 法语 | fr | 97% | 标准法语 |
| 德语 | de | 97% | 标准德语 |
| 西班牙语 | es | 96% | 多地区支持 |
| 俄语 | ru | 94% | 西里尔字母 |
多语言示例
用户: 识别这段英文语音
AI: 🎤 正在识别...
✅ 识别完成!
━━━━━━━━━━━━━━━━━━━
识别语言: 英语 (en-US)
识别时长: 3分28秒
准确率: 99%
识别文本:
"Good morning, everyone. Today we're going to discuss
the quarterly results and our plans for the next year..."
━━━━━━━━━━━━━━━━━━━
✅ 已生成文字版本
混合语言识别
用户: 这段有中英文混合
AI: 🎤 智能混合识别
━━━━━━━━━━━━━━━━━━━
检测到混合语言:
- 中文: 70%
- 英语: 30%
识别文本:
"今天我们来讨论一下AI的发展趋势。随着ChatGPT的推出,
large language models开始受到广泛关注..."
━━━━━━━━━━━━━━━━━━━
✅ 混合语言识别完成
⚡ 实时转写功能
实时转写特性
- 边说边转 - 说话同时生成文字
- 实时显示 - 文字实时显示
- 自动断句 - 智能断句分段
- 标点自动 - 自动添加标点
实时转写示例
用户: 开始实时转写
AI: 🎤 实时转写模式已启动
━━━━━━━━━━━━━━━━━━━
实时转写中...
[00:00] 今天我们来开会讨论
[00:03] 关于下一季度的销售计划
[00:08] 首先,我想请大家看一下数据
[00:14] 上个季度我们的销售额
[00:18] 达到了五千万
━━━━━━━━━━━━━━━━━━━
🔴 正在转写... | 停止转写
转写控制
用户: 暂停转写
AI: ⏸️ 转写已暂停
━━━━━━━━━━━━━━━━━━━
已转写时长: 5分32秒
转写字数: 890字
暂停位置:
"关于下个季度的计划,我建议..."
━━━━━━━━━━━━━━━━━━━
输入"继续"恢复转写
👥 说话人识别功能
说话人识别特性
- 自动区分 - 自动识别不同说话人
- 说话人标记 - 标记说话人编号
- 声纹学习 - 学习识别说话人
- 角色命名 - 自定义说话人名称
说话人识别示例
用户: 识别这段会议录音
AI: 🎤 正在分析说话人...
✅ 说话人识别完成!
━━━━━━━━━━━━━━━━━━━
检测到说话人: 3人
━━━━━━━━━━━━━━━━━━━
[说话人1] 00:00
大家好,今天我们开会讨论一下项目进展。
[说话人2] 00:12
好的,我先来汇报一下技术方面的情况。
[说话人3] 00:28
那我来说一下市场的反馈。
[说话人1] 01:05
好的,请继续...
━━━━━━━━━━━━━━━━━━━
是否为说话人命名?
说话人命名
用户: 说话人1是张总,说话人2是李工
AI: ✅ 已设置说话人名称
━━━━━━━━━━━━━━━━━━━
[张总] 00:00
大家好,今天我们开会讨论一下项目进展。
[李工] 00:12
好的,我先来汇报一下技术方面的情况。
[说话人3] 00:28
那我来说一下市场的反馈。
━━━━━━━━━━━━━━━━━━━
为说话人3命名?或添加新说话人?
📝 智能摘要功能
摘要类型
- 全文摘要 - 整体内容概述
- 重点提取 - 关键信息提取
- 待办事项 - 自动提取待办
- 决议记录 - 会议决议汇总
智能摘要示例
用户: 生成会议摘要
AI: 📝 会议摘要
━━━━━━━━━━━━━━━━━━━
📊 基本信息
- 会议时长: 45分钟
- 参与人数: 5人
- 讨论主题: 季度销售计划
📝 内容摘要
本次会议主要讨论了Q3季度的销售策略和目标。
团队分析了上半年的销售数据,确定了下半年的
重点客户群体,并制定了相应的营销方案。
🎯 重点内容
1. Q3销售目标: 800万
2. 重点客户: 科技行业Top50
3. 营销预算: 增加20%
4. 人员配置: 新增3名销售
📋 待办事项
□ 张总: 完成客户名单整理 (截止: 周五)
□ 李工: 准备产品演示PPT (截止: 周三)
□ 王经理: 联系重点客户 (截止: 下周一)
✅ 会议决议
1. 通过Q3销售目标方案
2. 批准营销预算增加
3. 同意招聘新销售人员
━━━━━━━━━━━━━━━━━━━
✅ 摘要已生成
🔇 音频降噪功能
降噪类型
- 背景噪音 - 去除环境噪音
- 风声噪音 - 去除风声
- 电流噪音 - 去除电流声
- 回声消除 - 消除回声
降噪示例
用户: 这段音频有噪音,帮我降噪
AI: 🔇 正在分析音频...
━━━━━━━━━━━━━━━━━━━
检测到噪音类型:
- 背景噪音: 35dB
- 电流声: 轻微
- 回声: 无
降噪处理中...
[████████████████████] 100%
✅ 降噪完成!
噪音对比:
┌─────────────────────┐
│ 原始: ████████ 35dB │
│ 降噪: ██░░░░░░ 8dB │
└─────────────────────┘
音质提升: 75%
识别准确率: +15%
━━━━━━━━━━━━━━━━━━━
✅ 已生成降噪版本
💾 离线识别功能
离线模式
用户: 切换到离线模式
AI: 💾 离线识别模式
━━━━━━━━━━━━━━━━━━━
离线模式特点:
✅ 无需网络连接
✅ 隐私数据不上传
✅ 快速本地处理
模型下载:
- 中文模型: 已下载 (85MB)
- 英文模型: 已下载 (75MB)
- 日语模型: 未下载
━━━━━━━━━━━━━━━━━━━
✅ 已切换到离线模式
注意:离线模式准确率略低于在线模式
离线模型管理
用户: 下载日语离线模型
AI: 💾 正在下载模型...
━━━━━━━━━━━━━━━━━━━
下载进度:
[████████████████░░░░] 80%
模型信息:
- 名称: Japanese v1.2
- 大小: 92MB
- 语言: 日语
- 准确率: 94%
━━━━━━━━━━━━━━━━━━━
✅ 日语离线模型已下载
使用方法
基础转写
用户: [上传语音文件]
AI: 🎤 正在转写...
✅ 转写完成!
━━━━━━━━━━━━━━━━━━━
文件信息:
- 时长: 5分32秒
- 格式: MP3
- 大小: 8.2MB
识别结果:
"大家好,今天我们来讨论一下项目的进展情况..."
━━━━━━━━━━━━━━━━━━━
是否下载文字版本?
会议转写
用户: 转写这段会议录音,生成纪要
AI: 🎤 会议转写模式
━━━━━━━━━━━━━━━━━━━
处理步骤:
1️⃣ 音频预处理
2️⃣ 语音识别
3️⃣ 说话人识别
4️⃣ 内容摘要
5️⃣ 生成纪要
━━━━━━━━━━━━━━━━━━━
✅ 会议纪要已生成
📄 会议纪要文档:
- 完整转写文本
- 说话人区分
- 重点摘要
- 待办事项
- 决议记录
是否下载文档?
多格式支持
用户: 支持什么音频格式?
AI: 🎵 支持的音频格式
━━━━━━━━━━━━━━━━━━━
常用格式:
✅ MP3 - 最常用
✅ WAV - 无损音质
✅ M4A - Apple格式
✅ FLAC - 无损压缩
视频格式:
✅ MP4 - 提取音频
✅ MOV - 提取音频
✅ AVI - 提取音频
录音格式:
✅ AMR - 手机录音
✅ OGG - 在线录音
✅ AAC - 高压缩比
━━━━━━━━━━━━━━━━━━━
支持批量上传,自动转换格式
💰 付费方案
| 版本 | 价格 | 功能 |
|---|---|---|
| 免费版 | ¥0 | 每天10分钟转写 |
| 基础版 | ¥15.9/月 | 每天60分钟、多语言 |
| Pro版 | ¥39.9/月 | 无限时长、说话人识别、智能摘要 |
| 企业版 | ¥149/月 | 团队共享、API接口、优先处理 |
🎯 使用场景
会议记录
- 会议实时转写
- 自动生成纪要
- 待办事项提取
采访整理
- 采访录音转文字
- 说话人区分
- 内容快速整理
课程学习
- 讲座内容转写
- 学习笔记生成
- 重点内容标注
语音备忘
- 随时语音记录
- 快速转文字
- 便于检索查找
💡 智能特性
智能断句
- 根据语气自动断句
- 智能添加标点
- 保持语义完整
智能学习
- 学习专业术语
- 适应说话习惯
- 提高识别准确率
智能搜索
- 文本内容搜索
- 时间点定位
- 关键词高亮
📊 成功案例
"会议转写功能太棒了,自动区分说话人,大大节省了整理纪要的时间!" —— 用户A,项目经理
"支持50多种语言,跨国会议也能轻松转写,工作效率提升3倍!" —— 用户B,国际业务主管
让语音转文字变得简单高效 🎤
更新日志:
- v1.1.0 (2025-03-04): 新增多语言识别、实时转写、说话人识别、智能摘要、音频降噪、离线识别
- v1.0.0 (2025-02-01): 初始版本,支持语音转文字、会议纪要生成
Reviews (0)
Sign in to write a review.
No reviews yet. Be the first to review!
Comments (0)
No comments yet. Be the first to share your thoughts!