Obsidian 插件:Speech to Text
插件名片
概述
1. 主要功能
该插件可利用多个AI提供商(OpenAI Whisper、Deepgram)将音频记录转换为文本,支持多种音频格式,具备说话人分离、自动语言检测等功能,能将转录文本插入当前光标位置、笔记开头或结尾,还可自动创建新笔记。
2. 适用场景
适用于会议记录、访谈整理、日常语音笔记等场景,方便用户将音频内容快速转化为文字。
3. 核心特色
- 多提供商选择,各有优势,能自动为每个文件选择最佳提供商。
- 支持40多种语言,自动检测语言,不同提供商针对不同语言进行优化。
- 说话人分离功能可清晰区分不同说话者,方便处理多人对话。
4. 使用建议
使用前确保已配置好AI提供商的相关密钥。对于不同格式和语言的音频,可先让插件自动选择提供商进行转录,若效果不佳,可手动更换提供商。在处理多人音频时,利用说话人分离功能能使文本更有条理。
Help这篇插件文章还没有人贡献,欢迎占坑!
如果您有好的想法欢迎提交PR或者文末留言。
讨论
若阁下有独到的见解或新颖的想法,诚邀您在文章下方留言,与大家共同探讨。
反馈交流
其他渠道
版权声明
版权声明:所有 PKMer 文章如果需要转载,请附上原文出处链接。