如何运用免费工具转写视频字幕

Chenghuang 于 2024-05-15 23:58 发布

分类专栏：

文章标签：

如何运用免费工具转写视频字幕

为方便普通用户使用，有大神在 github 上推出了图形化工具，如此一来，用户不必掌握复杂的命令行指令也能轻松使用 faster-whisper 的模型完成视频字幕的转写，无论是制作视频还是翻译字幕的效率都能得到极大提升，以下是具体操作步骤。

有关 faster-whisper

根据 faster-whisper 的 github 页面简介可知：它是一款在 OpenAI 推出的开源高精度语音识别模型“Whisper”基础上重新开发的第三方版本，它号称运行速度最多能提高到 Whisper 的 4 倍。¹

前期准备

在 FFmepg下载页面下载并安装 FFmpeg；
在 faster-whisper-GUI下载页面的 asset 板块下载最新版本的安装程序，（注意：不要下载带有“source code”字样的文件，需要下载的是后缀为“exe”的文件，如 github 下载速度较慢，可尝试将链接发到手机，速度或许会快一些，手机端下载完成后再将 exe 文件传回电脑）；
右键单击下载完成的安装程序，选择 以管理员身份运行，将 faster-whisper-GUI 安装到电脑上；
在 huggingface 网站搜索 faster whisper 字样，选择并下载所需模型（model）
1. 需要指出的是，模型存在多种细分类别，如果电脑性能较差，选择下载以 tiny、base、small 结尾的模型；如果电脑性能优异，可以下载以 medium 和 large 结尾的模型。
2. 另外，有的模型只包括特定语言种类，上传者会将语言代码附在最后，可参考维基百科对于语言代码的简介，如果下载的通用模型不能满足你的需求，不妨试着下载特定语言种类的模型，或有意外之喜。
3. 一般来说，模型越大越新，转写精度就越高；
可以在软件根目录下创建一个 model 文件夹，将下载好的模型文件放到里面。

具体操作

需要注意的是，每次打开 FasterWhisperGUI 时都需要以管理员身份运行，也可在右键菜单中选择 属性→兼容性→以管理员身份运行此程序，以后只要双击即可打开；
在左侧边栏选择 模型参数，在 使用本地模型 中选择下载好的模型文件所在文件夹，点击右上角 加载模型 大按钮；如果你使用的是 v3 模型，打开下方 使用v3模型 选项；如果你使用的是英伟达（Nvidia）显卡，在 处理设备 选项中选择 cuda；
在左侧边栏选择 执行转写，点击主页面右侧的 + 号选择需要转写的视频文件，待软件提示转写完成，点击跳转到 whisperX及字幕编辑，点击字幕上方 保存字幕文件 即可，可在右侧 输出文件格式 选择需要保存的字幕格式；
有时模型会错误识别片源语言，这时可以在左侧边栏选择 转写参数，在 音频语言 选项自主指定片源语言；
可在左侧边栏左下角的 设置 中对软件进行自定义，需要注意的是，FasterWhisperGUI 每次更新都需要手动卸载旧版本，再安装新版本，可在卸载前于 配置文件 选项选择 备份当前配置，在重装后选择 加载配置文件 以保证设置的前后一致性。

最后

faster-whisper-GUI 还可以将人的说话声和其他环境音分离开或对字幕进行简单处理，请自行探索，在此不做赘述。

GitHub - SYSTRAN/faster-whisper ↩

讨论

若阁下有独到的见解或新颖的想法，诚邀您在文章下方留言，与大家共同探讨。

#视频字幕 #faster-whisper-GUI

Chenghuang12篇文章

反馈交流

AI 客服

QQ群

微信群 Pkmer微信群

其他渠道

本文链接：https://pkmer.cn/show/20240515235516

Zotero 插件

Zotero 教程

Obsidian 插件

Obsidian 主题

Obsidian 教程

Obsidian 示例库

PKMer Market

挂件集市^New!

Thino^Hot!

ZK卡实例库

社区投票

如何运用免费工具转写视频字幕

前期准备

具体操作

最后

Zotero 插件

Zotero 教程

Obsidian 插件

Obsidian 主题

Obsidian 教程

Obsidian 示例库

PKMer Market

挂件集市 New!

Thino Hot!

ZK卡实例库

社区投票

如何运用免费工具转写视频字幕

前期准备

具体操作

最后

Footnotes

挂件集市^New!

Thino^Hot!