一、环境部署
1.创建虚拟环境
打开 Anaconda Prompt 或 win+r→cmd 命令窗口,输入以下命令并回车
conda create –n py3.12-torch2.5.1 python==3.12
会得到名称为“py3.12-torch2.5.1”的虚拟环境,它将用来搭建搭建 Pytorch2.5.1 深度学习平台。
conda env remove -n py3.12-torch2.5.1来删除虚拟环境及环境中所有的包。
2.配置pytorch
将压缩包内以下3个文件:
拷贝到以下路径:
然后在在Anaconda \envs\py3.12-torch2.5.1\Scripts”目录栏下输入“cmd”回车激活命令窗口,并在该窗口输入“conda activate py3.12-torch2.5.1”回车激活 py3.12-torch2.5.1环境。
在环境下输入:
pip install torchvision-0.20.1+cu124-cp312-cp312-win_amd64.whl
安装完后,接着输入 :
pip install torchaudio-2.5.1+cu124-cp312-cp312-win_amd64.whl
完成后继续输入:
pip install torch-2.5.1+cu124-cp312-cp312-win_amd64.whl
3.PyCharm 切换编译器
如下图,将编译器切换为创建的虚拟环境:
4.pyvideotrans项目文件
(1) 从github仓库克隆源码
地址:https://github.com/jianchang512/pyvideotrans
(2)直接从附件 pyvideotrans.zip 解压, 这是预先从仓库克隆下来的代码, 避免无法访问造成克隆失败的问题。
然后利用pycharm打开该工程文件到终端输入以下代码安装其他依赖库:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r .\requirements.txt
5.安装ffmpeg,
将附件里ffmpeg.zip中文件解压到项目目录下
6.准备好语音模型
将附件中faster-medium.7z 和 faster-small.7z解压到项目中的models目录下, 解压后,目录中应该存在 models--Systran--faster-whisper-small
models--Systran--faster-whisper-medium 两个目录
删除\pyvideotrans\videotrans\cfg.json文件,运行时将会自动重建路径配置文件。
二、实验步骤
执行完以上这些事情, 那么所有准备工作都完成了, 现在打开 sp.py文件并运行,将会打开此界面:
语音识别选择faster-whisper(本地),模型选择预先下载并保存的medium,然后选择好要处理的视频以及保存到的位置,这里我选择了一个名为why not的英文演讲视频,保存在桌面_vedio_out文件下。
点击开始翻译后,首先右侧会提取出英文字幕,然后根据英文字母在右侧翻译成中文。
三、实验结果分析
*.mp4 = 最终完成的目标视频文件
en.m4a|.wav = 原始视频中的音频文件(包含所有背景音和人声)
zh-cn.m4a = 配音后的音频文件(若选择了保留背景音乐则已混入)
en.srt = 原始视频中根据声音识别出的字幕文件
zh-cn.srt = 翻译为目标语言后字幕文件
shuang.srt = 双语字幕
vocal.wav = 原始视频中分离出的人声音频文件
instrument.wav = 原始视频中分离出的背景音乐音频文件
原视频下方增加了一行中文字幕
四、语音模型下载地址
这个项目支持很多中模型, 但是由于模型大小的原因, 只附带了两个小模型, 使用方法见此:
https://pyvideotrans.com/model#faster-whisper-%E6%A8%A1%E5%9E%8B%E4%B8%8B%E8%BD%BD-%E9%80%82%E7%94%A8%E4%BA%8E-stt-%E9%A1%B9%E7%9B%AE-%E5%92%8C-pyvideotrans%E8%A7%86%E9%A2%91%E7%BF%BB%E8%AF%91%E9%85%8D%E9%9F%B3-%E9%A1%B9%E7%9B%AE%E7%9A%84faster-whisper%E6%A8%A1%E5%BC%8F%E4%BD%BF%E7%94%A8-openai-whisper%E6%A8%A1%E5%9E%8B%E8%AF%B7%E5%BE%80%E4%B8%8B%E6%8B%89
使用方法见此文档: 使用入门 | pyVideoTrans官网-开源免费的视频翻译配音软件-pyvideotrans.com github.com/jianchang512/pyvideotrans