在某些场景下,我们需要提取视频文件中的字幕信息。
视频字幕分为两种,硬字幕和软字幕。硬字幕就是固定在画面上的,不能关闭的。 软字幕就是可以开关的。
软字幕是有单独的文件存储,所以想要做其他用处是比较方便的;硬字幕的提取就比较麻烦了,需要使用一些特别的方法。
本文给大家介绍一款软件,可以将视频的硬字幕提取出来。

该软件主要实现了以下功能:
- 提取视频中的关键帧
- 检测视频帧中文本的所在位置
- 识别视频帧中文本的内容
- 过滤非字幕区域的文本,去除水印(台标)文本
- 去除重复字幕行,生成 srt 字幕文件
- 支持视频字幕批量提取(打开文件的时候选择多个视频)
- 多语言:支持中文/英文、日语、韩语、阿拉伯语、繁体中文、法语、德语、俄语、西班牙语、葡萄牙语、意大利语字幕的提取
- 多模式:
- 快速 - 快速提取字幕但可能丢字幕(推荐)
- 精准 - 不丢字幕但速度较慢
注意:视频以及程序路径请不要带中文和空格,否则可能出现未知错误!!!
软件开启方法如下:
-
在本文最下方的链接中下载程序包;
-
打开解压好的文件夹,在地址栏输入 cmd 打开命令行窗口
注意:确保电脑安装了Python解释器;
-
在命令行窗口输入以下命令,点击
Enter
运行指令安装对应模块,安装成功后,之后使用软件只需要执行第4步即可pip install -r requirements.txt
-
在终端执行以下命令开启软件
python gui.py
操作方法
点击【打开】后选择视频文件,调整字幕区域,点击【运行】等待即可。
运行时间较长,耐心等待即可,命令行窗口可以看到大概进度。
完成后可以在视频目录中看到生成的字幕文件。
软件特点
- 采用本地进行 OCR 识别,无需设置调用任何 API
- 支持 GPU 加速,有兴趣可以阅读文件夹中的说明文档探索一下,GPU 加速后可以获得更高的准确率与更快的提取速度
- ( CLI 版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
- ( GUI 版本) 图形化界面
提取速度
- ( CLI 版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
- ( GUI 版本) 图形化界面