步骤
-
打开WhisperDesktop,选择模型
这里以medium(中等)模型进行演示
-
选择语言,选择视频源文件,选择输出格式,选择字幕输出位置,点击转写按钮
输出格式五个选项:无、文本文件、带时间戳的文本、SubRip字幕(srt)、WebVTT字幕(vtt)
-
转写完成,用时6.8秒
如果转出来是繁体,可以用下文提供的简繁转换工具
进行转换
模型
官方的模型是.pt格式,我们使用WhisperDesktop是基于官方工具封装的,要使用这里给出的模型,是Whisper的ggml版本,也就是Whisper.cpp
模型名字中带en
的是纯英文模型
从大到小依次为tiny、base、small、medium、large,一般使用medium模型就够了,越大的模型除了效果越好,本文使用的模型是ggml-medium.bin
官方下载地址
在CSDN下载模型和软件
点开我的主页,在资源中下载