🧪 Skills

Voice Note Transcriber Cn

语音笔记转文字工具 v2.1 | Voice Note Transcriber. 支持多语言识别、实时转写、说话人识别、智能摘要、音频降噪、离线识别。触发词:转写、识别、语音。

v1.1.0
❤️ 0
⬇️ 160
👁 1
Share

Description


name: voice-note-transcriber-cn version: 1.1.0 description: "语音笔记转文字工具 v2.1 | Voice Note Transcriber. 支持多语言识别、实时转写、说话人识别、智能摘要、音频降噪、离线识别。触发词:转写、识别、语音。" author: 赚钱小能手 metadata: clawhub: emoji: 🎤 requires: bins: [ffmpeg, whisper]

语音笔记转文字工具 v2.1 🎤

智能语音识别,支持实时转写、多语言识别、说话人识别、会议纪要自动生成、音频降噪、离线识别。

🎯 核心功能

✨ v1.1新增功能

  • 🌍 多语言识别 - 支持50+语言识别
  • 实时转写 - 边说边转文字
  • 👥 说话人识别 - 多人对话自动区分
  • 📝 智能摘要 - 自动生成摘要和重点
  • 🔇 音频降噪 - 自动去除背景噪音
  • 💾 离线识别 - 无网络也能使用

🎤 原有功能

  • 🎙️ 语音转文字
  • 📄 会议纪要生成
  • 📊 转写准确率统计

🌍 多语言识别功能

支持的语言

语言 代码 准确率 特点
中文(简体) zh-CN 98% 支持方言
中文(繁体) zh-TW 97% 台湾用语
英语(美式) en-US 99% 口音适应
英语(英式) en-GB 99% 英式表达
日语 ja 96% 敬语识别
韩语 ko 95% 敬语识别
法语 fr 97% 标准法语
德语 de 97% 标准德语
西班牙语 es 96% 多地区支持
俄语 ru 94% 西里尔字母

多语言示例

用户: 识别这段英文语音
AI: 🎤 正在识别...

✅ 识别完成!

━━━━━━━━━━━━━━━━━━━
识别语言: 英语 (en-US)
识别时长: 3分28秒
准确率: 99%

识别文本:
"Good morning, everyone. Today we're going to discuss 
the quarterly results and our plans for the next year..."

━━━━━━━━━━━━━━━━━━━
✅ 已生成文字版本

混合语言识别

用户: 这段有中英文混合
AI: 🎤 智能混合识别

━━━━━━━━━━━━━━━━━━━
检测到混合语言:
- 中文: 70%
- 英语: 30%

识别文本:
"今天我们来讨论一下AI的发展趋势。随着ChatGPT的推出,
large language models开始受到广泛关注..."

━━━━━━━━━━━━━━━━━━━
✅ 混合语言识别完成

⚡ 实时转写功能

实时转写特性

  • 边说边转 - 说话同时生成文字
  • 实时显示 - 文字实时显示
  • 自动断句 - 智能断句分段
  • 标点自动 - 自动添加标点

实时转写示例

用户: 开始实时转写
AI: 🎤 实时转写模式已启动

━━━━━━━━━━━━━━━━━━━
实时转写中...

[00:00] 今天我们来开会讨论
[00:03] 关于下一季度的销售计划
[00:08] 首先,我想请大家看一下数据
[00:14] 上个季度我们的销售额
[00:18] 达到了五千万

━━━━━━━━━━━━━━━━━━━
🔴 正在转写... | 停止转写

转写控制

用户: 暂停转写
AI: ⏸️ 转写已暂停

━━━━━━━━━━━━━━━━━━━
已转写时长: 5分32秒
转写字数: 890字

暂停位置:
"关于下个季度的计划,我建议..."

━━━━━━━━━━━━━━━━━━━
输入"继续"恢复转写

👥 说话人识别功能

说话人识别特性

  • 自动区分 - 自动识别不同说话人
  • 说话人标记 - 标记说话人编号
  • 声纹学习 - 学习识别说话人
  • 角色命名 - 自定义说话人名称

说话人识别示例

用户: 识别这段会议录音
AI: 🎤 正在分析说话人...

✅ 说话人识别完成!

━━━━━━━━━━━━━━━━━━━
检测到说话人: 3人

━━━━━━━━━━━━━━━━━━━
[说话人1] 00:00
大家好,今天我们开会讨论一下项目进展。

[说话人2] 00:12
好的,我先来汇报一下技术方面的情况。

[说话人3] 00:28
那我来说一下市场的反馈。

[说话人1] 01:05
好的,请继续...

━━━━━━━━━━━━━━━━━━━
是否为说话人命名?

说话人命名

用户: 说话人1是张总,说话人2是李工
AI: ✅ 已设置说话人名称

━━━━━━━━━━━━━━━━━━━
[张总] 00:00
大家好,今天我们开会讨论一下项目进展。

[李工] 00:12
好的,我先来汇报一下技术方面的情况。

[说话人3] 00:28
那我来说一下市场的反馈。

━━━━━━━━━━━━━━━━━━━
为说话人3命名?或添加新说话人?

📝 智能摘要功能

摘要类型

  • 全文摘要 - 整体内容概述
  • 重点提取 - 关键信息提取
  • 待办事项 - 自动提取待办
  • 决议记录 - 会议决议汇总

智能摘要示例

用户: 生成会议摘要
AI: 📝 会议摘要

━━━━━━━━━━━━━━━━━━━
📊 基本信息
- 会议时长: 45分钟
- 参与人数: 5人
- 讨论主题: 季度销售计划

📝 内容摘要
本次会议主要讨论了Q3季度的销售策略和目标。
团队分析了上半年的销售数据,确定了下半年的
重点客户群体,并制定了相应的营销方案。

🎯 重点内容
1. Q3销售目标: 800万
2. 重点客户: 科技行业Top50
3. 营销预算: 增加20%
4. 人员配置: 新增3名销售

📋 待办事项
□ 张总: 完成客户名单整理 (截止: 周五)
□ 李工: 准备产品演示PPT (截止: 周三)
□ 王经理: 联系重点客户 (截止: 下周一)

✅ 会议决议
1. 通过Q3销售目标方案
2. 批准营销预算增加
3. 同意招聘新销售人员

━━━━━━━━━━━━━━━━━━━
✅ 摘要已生成

🔇 音频降噪功能

降噪类型

  • 背景噪音 - 去除环境噪音
  • 风声噪音 - 去除风声
  • 电流噪音 - 去除电流声
  • 回声消除 - 消除回声

降噪示例

用户: 这段音频有噪音,帮我降噪
AI: 🔇 正在分析音频...

━━━━━━━━━━━━━━━━━━━
检测到噪音类型:
- 背景噪音: 35dB
- 电流声: 轻微
- 回声: 无

降噪处理中...
[████████████████████] 100%

✅ 降噪完成!

噪音对比:
┌─────────────────────┐
│ 原始: ████████ 35dB │
│ 降噪: ██░░░░░░ 8dB  │
└─────────────────────┘

音质提升: 75%
识别准确率: +15%

━━━━━━━━━━━━━━━━━━━
✅ 已生成降噪版本

💾 离线识别功能

离线模式

用户: 切换到离线模式
AI: 💾 离线识别模式

━━━━━━━━━━━━━━━━━━━
离线模式特点:
✅ 无需网络连接
✅ 隐私数据不上传
✅ 快速本地处理

模型下载:
- 中文模型: 已下载 (85MB)
- 英文模型: 已下载 (75MB)
- 日语模型: 未下载

━━━━━━━━━━━━━━━━━━━
✅ 已切换到离线模式
注意:离线模式准确率略低于在线模式

离线模型管理

用户: 下载日语离线模型
AI: 💾 正在下载模型...

━━━━━━━━━━━━━━━━━━━
下载进度:
[████████████████░░░░] 80%

模型信息:
- 名称: Japanese v1.2
- 大小: 92MB
- 语言: 日语
- 准确率: 94%

━━━━━━━━━━━━━━━━━━━
✅ 日语离线模型已下载

使用方法

基础转写

用户: [上传语音文件]
AI: 🎤 正在转写...

✅ 转写完成!

━━━━━━━━━━━━━━━━━━━
文件信息:
- 时长: 5分32秒
- 格式: MP3
- 大小: 8.2MB

识别结果:
"大家好,今天我们来讨论一下项目的进展情况..."

━━━━━━━━━━━━━━━━━━━
是否下载文字版本?

会议转写

用户: 转写这段会议录音,生成纪要
AI: 🎤 会议转写模式

━━━━━━━━━━━━━━━━━━━
处理步骤:
1️⃣ 音频预处理
2️⃣ 语音识别
3️⃣ 说话人识别
4️⃣ 内容摘要
5️⃣ 生成纪要

━━━━━━━━━━━━━━━━━━━
✅ 会议纪要已生成

📄 会议纪要文档:
- 完整转写文本
- 说话人区分
- 重点摘要
- 待办事项
- 决议记录

是否下载文档?

多格式支持

用户: 支持什么音频格式?
AI: 🎵 支持的音频格式

━━━━━━━━━━━━━━━━━━━
常用格式:
✅ MP3 - 最常用
✅ WAV - 无损音质
✅ M4A - Apple格式
✅ FLAC - 无损压缩

视频格式:
✅ MP4 - 提取音频
✅ MOV - 提取音频
✅ AVI - 提取音频

录音格式:
✅ AMR - 手机录音
✅ OGG - 在线录音
✅ AAC - 高压缩比

━━━━━━━━━━━━━━━━━━━
支持批量上传,自动转换格式

💰 付费方案

版本 价格 功能
免费版 ¥0 每天10分钟转写
基础版 ¥15.9/月 每天60分钟、多语言
Pro版 ¥39.9/月 无限时长、说话人识别、智能摘要
企业版 ¥149/月 团队共享、API接口、优先处理

🎯 使用场景

会议记录

  • 会议实时转写
  • 自动生成纪要
  • 待办事项提取

采访整理

  • 采访录音转文字
  • 说话人区分
  • 内容快速整理

课程学习

  • 讲座内容转写
  • 学习笔记生成
  • 重点内容标注

语音备忘

  • 随时语音记录
  • 快速转文字
  • 便于检索查找

💡 智能特性

智能断句

  • 根据语气自动断句
  • 智能添加标点
  • 保持语义完整

智能学习

  • 学习专业术语
  • 适应说话习惯
  • 提高识别准确率

智能搜索

  • 文本内容搜索
  • 时间点定位
  • 关键词高亮

📊 成功案例

"会议转写功能太棒了,自动区分说话人,大大节省了整理纪要的时间!" —— 用户A,项目经理

"支持50多种语言,跨国会议也能轻松转写,工作效率提升3倍!" —— 用户B,国际业务主管


让语音转文字变得简单高效 🎤

更新日志

  • v1.1.0 (2025-03-04): 新增多语言识别、实时转写、说话人识别、智能摘要、音频降噪、离线识别
  • v1.0.0 (2025-02-01): 初始版本,支持语音转文字、会议纪要生成

Reviews (0)

Sign in to write a review.

No reviews yet. Be the first to review!

Comments (0)

Sign in to join the discussion.

No comments yet. Be the first to share your thoughts!

Compatible Platforms

Pricing

Free

Related Configs