本地部署 pyvideotrans（视频翻译配音工具）

西唯兵欧泡

已于 2025-04-01 18:05:15 修改

阅读量992

点赞数 9

文章标签：音视频人工智能 python pytorch

于 2025-04-01 17:40:27 首次发布

本文链接：https://blog.csdn.net/2202_75442297/article/details/146918335

版权

一、环境部署

1.创建虚拟环境

打开 Anaconda Prompt 或 win+r→cmd 命令窗口，输入以下命令并回车

conda create –n py3.12-torch2.5.1 python==3.12

会得到名称为“py3.12-torch2.5.1”的虚拟环境，它将用来搭建搭建 Pytorch2.5.1 深度学习平台。

conda env remove -n py3.12-torch2.5.1来删除虚拟环境及环境中所有的包。

2.配置pytorch

将压缩包内以下3个文件：

拷贝到以下路径：

然后在在Anaconda \envs\py3.12-torch2.5.1\Scripts”目录栏下输入“cmd”回车激活命令窗口，并在该窗口输入“conda activate py3.12-torch2.5.1”回车激活 py3.12-torch2.5.1环境。

在环境下输入：

pip install torchvision-0.20.1+cu124-cp312-cp312-win_amd64.whl

安装完后，接着输入：

pip install torchaudio-2.5.1+cu124-cp312-cp312-win_amd64.whl

完成后继续输入：

pip install torch-2.5.1+cu124-cp312-cp312-win_amd64.whl

3.PyCharm 切换编译器

如下图，将编译器切换为创建的虚拟环境：

4.pyvideotrans项目文件

（1）从github仓库克隆源码

地址:https://github.com/jianchang512/pyvideotrans

（2）直接从附件 pyvideotrans.zip 解压, 这是预先从仓库克隆下来的代码, 避免无法访问造成克隆失败的问题。

然后利用pycharm打开该工程文件到终端输入以下代码安装其他依赖库：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r .\requirements.txt

5.安装ffmpeg,

将附件里ffmpeg.zip中文件解压到项目目录下

ffmpeg安装地址：https://github.com/BtbN/FFmpeg-Builds/releases/download/autobuild-2023-11-30-12-55/ffmpeg-n6.0.1-win64-gpl-6.0.zip

6.准备好语音模型

将附件中faster-medium.7z 和 faster-small.7z解压到项目中的models目录下, 解压后,目录中应该存在 models--Systran--faster-whisper-small

models--Systran--faster-whisper-medium 两个目录

删除\pyvideotrans\videotrans\cfg.json文件，运行时将会自动重建路径配置文件。

二、实验步骤

执行完以上这些事情, 那么所有准备工作都完成了, 现在打开 sp.py文件并运行，将会打开此界面：

语音识别选择faster-whisper(本地)，模型选择预先下载并保存的medium，然后选择好要处理的视频以及保存到的位置，这里我选择了一个名为why not的英文演讲视频，保存在桌面_vedio_out文件下。

点击开始翻译后，首先右侧会提取出英文字幕，然后根据英文字母在右侧翻译成中文。

三、实验结果分析

*.mp4 = 最终完成的目标视频文件

en.m4a|.wav = 原始视频中的音频文件(包含所有背景音和人声)

zh-cn.m4a = 配音后的音频文件(若选择了保留背景音乐则已混入)

en.srt = 原始视频中根据声音识别出的字幕文件

zh-cn.srt = 翻译为目标语言后字幕文件

shuang.srt = 双语字幕

vocal.wav = 原始视频中分离出的人声音频文件

instrument.wav = 原始视频中分离出的背景音乐音频文件

原视频下方增加了一行中文字幕

四、语音模型下载地址

这个项目支持很多中模型, 但是由于模型大小的原因, 只附带了两个小模型, 使用方法见此:

https://pyvideotrans.com/model#faster-whisper-%E6%A8%A1%E5%9E%8B%E4%B8%8B%E8%BD%BD-%E9%80%82%E7%94%A8%E4%BA%8E-stt-%E9%A1%B9%E7%9B%AE-%E5%92%8C-pyvideotrans%E8%A7%86%E9%A2%91%E7%BF%BB%E8%AF%91%E9%85%8D%E9%9F%B3-%E9%A1%B9%E7%9B%AE%E7%9A%84faster-whisper%E6%A8%A1%E5%BC%8F%E4%BD%BF%E7%94%A8-openai-whisper%E6%A8%A1%E5%9E%8B%E8%AF%B7%E5%BE%80%E4%B8%8B%E6%8B%89

使用方法见此文档: 使用入门 | pyVideoTrans官网-开源免费的视频翻译配音软件-pyvideotrans.com github.com/jianchang512/pyvideotrans