本地部署 pyvideotrans(视频翻译配音工具)

一、环境部署

1.创建虚拟环境

打开 Anaconda Prompt 或 win+r→cmd 命令窗口,输入以下命令并回车

conda create –n py3.12-torch2.5.1 python==3.12

会得到名称为“py3.12-torch2.5.1”的虚拟环境,它将用来搭建搭建 Pytorch2.5.1 深度学习平台。

conda env remove -n py3.12-torch2.5.1来删除虚拟环境及环境中所有的包。

2.配置pytorch

将压缩包内以下3个文件:

拷贝到以下路径:

 然后在在Anaconda \envs\py3.12-torch2.5.1\Scripts”目录栏下输入“cmd”回车激活命令窗口,并在该窗口输入“conda activate py3.12-torch2.5.1”回车激活 py3.12-torch2.5.1环境。

在环境下输入:

pip install torchvision-0.20.1+cu124-cp312-cp312-win_amd64.whl

安装完后,接着输入 :

pip install torchaudio-2.5.1+cu124-cp312-cp312-win_amd64.whl

完成后继续输入:

pip install torch-2.5.1+cu124-cp312-cp312-win_amd64.whl

3.PyCharm 切换编译器

如下图,将编译器切换为创建的虚拟环境:

4.pyvideotrans项目文件

(1) 从github仓库克隆源码

地址:https://github.com/jianchang512/pyvideotrans

(2)直接从附件 pyvideotrans.zip 解压, 这是预先从仓库克隆下来的代码, 避免无法访问造成克隆失败的问题。

然后利用pycharm打开该工程文件到终端输入以下代码安装其他依赖库:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r .\requirements.txt

5.安装ffmpeg,

将附件里ffmpeg.zip中文件解压到项目目录下

ffmpeg安装地址:https://github.com/BtbN/FFmpeg-Builds/releases/download/autobuild-2023-11-30-12-55/ffmpeg-n6.0.1-win64-gpl-6.0.zip

6.准备好语音模型

将附件中faster-medium.7z 和 faster-small.7z解压到项目中的models目录下, 解压后,目录中应该存在 models--Systran--faster-whisper-small

models--Systran--faster-whisper-medium 两个目录

删除\pyvideotrans\videotrans\cfg.json文件,运行时将会自动重建路径配置文件。

二、实验步骤

执行完以上这些事情, 那么所有准备工作都完成了, 现在打开 sp.py文件并运行,将会打开此界面:

语音识别选择faster-whisper(本地),模型选择预先下载并保存的medium,然后选择好要处理的视频以及保存到的位置,这里我选择了一个名为why not的英文演讲视频,保存在桌面_vedio_out文件下。

点击开始翻译后,首先右侧会提取出英文字幕,然后根据英文字母在右侧翻译成中文。

三、实验结果分析

*.mp4 = 最终完成的目标视频文件

en.m4a|.wav = 原始视频中的音频文件(包含所有背景音和人声)

zh-cn.m4a = 配音后的音频文件(若选择了保留背景音乐则已混入)

en.srt = 原始视频中根据声音识别出的字幕文件

zh-cn.srt = 翻译为目标语言后字幕文件

shuang.srt = 双语字幕

vocal.wav = 原始视频中分离出的人声音频文件

instrument.wav = 原始视频中分离出的背景音乐音频文件

原视频下方增加了一行中文字幕

四、语音模型下载地址

这个项目支持很多中模型, 但是由于模型大小的原因, 只附带了两个小模型, 使用方法见此: 

https://pyvideotrans.com/model#faster-whisper-%E6%A8%A1%E5%9E%8B%E4%B8%8B%E8%BD%BD-%E9%80%82%E7%94%A8%E4%BA%8E-stt-%E9%A1%B9%E7%9B%AE-%E5%92%8C-pyvideotrans%E8%A7%86%E9%A2%91%E7%BF%BB%E8%AF%91%E9%85%8D%E9%9F%B3-%E9%A1%B9%E7%9B%AE%E7%9A%84faster-whisper%E6%A8%A1%E5%BC%8F%E4%BD%BF%E7%94%A8-openai-whisper%E6%A8%A1%E5%9E%8B%E8%AF%B7%E5%BE%80%E4%B8%8B%E6%8B%89 

使用方法见此文档: 使用入门 | pyVideoTrans官网-开源免费的视频翻译配音软件-pyvideotrans.com github.com/jianchang512/pyvideotrans

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

西唯兵欧泡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值