Ai视频翻译神器来袭！pyVideoTrans一键搞定字幕与配音，免费开源

最新推荐文章于 2025-04-01 17:40:27 发布

天夏Ai

最新推荐文章于 2025-04-01 17:40:27 发布

阅读量1.4k

点赞数 9

文章标签：人工智能 python AIGC deep learning ai 音视频

本文链接：https://blog.csdn.net/weixin_44239830/article/details/146046223

版权

1.前言

各位小伙伴们，大家好呀！欢迎关注 天夏Ai，全网同名，我们致力于为大家挖掘和分享各种 精品实用的人工智能（Ai）资源，包括但不限于**：Ai黑科技工具软件、Ai副业创业项目、Ai智能硬件设备！**

**Ai 黑科技工具软件：**这些软件拥有强大的功能和创新的算法，无论是提升工作效率，还是满足个人兴趣爱好，都能为你提供独特的解决方案，让你在使用过程中感受到科技的魅力与力量。
**Ai 副业创业项目：**如果你正在寻找新的发展机会，我们的Ai副业创业项目或许能为你打开一扇新的大门。这些项目结合了当下热门的人工智能技术与市场需求，为你提供可行的商业模式和操作指南，助力你在创业的道路上迈出坚实的一步。
**Ai 智能硬件设备：**这些智能硬件设备在Ai绘画、Ai问答、Ai音频和Ai视频等多个领域发挥着重要作用，为用户提供了强大的计算能力和高效的数据处理能力，极大地提升了创作和处理效率。

无论你是科技爱好者，还是想要在事业上寻求突破，天夏Ai 都将是你的不二之选。在这里，你将发现人工智能的无限可能，获取更多精品实用的Ai资源，开启一段精彩的科技之旅。

2.pyVideoTrans介绍

pyVideoTrans 是一款开源免费的视频翻译配音软件，旨在帮助用户轻松地将视频内容从一种语言转换为另一种语言，并生成带有字幕和配音的新视频。用户可以免费下载和使用，无需登录或注册。

image.png

2.1.核心功能

视频翻译：它能够识别原视频中的说话声，并自动生成字幕，然后翻译为目标语言字幕，接着为目标语言字幕配音生成音频，再将配音音频、目标语言字幕同原始视频合并，生成新的视频，从而实现视频翻译。
语音识别转录：支持批量将音频或视频文件转录为SRT字幕
SRT字幕翻译：可将SRT字幕保持原格式和时间戳的前提下翻译为其他语言
为字幕或文字配音：为SRT字幕或文字生成配音，支持多种配音渠道

此外还有音频视频字幕合并、批量视频音频合并、批量视频字幕合并、人声背景音分离等辅助功能。

2.2.技术特点

多种语音识别/配音/翻译渠道：集成了多种主流的语音识别、文字配音和翻译技术，包括 edgeTTS、Azure、OpenAI、GPT-SoVITS、Gemini 和 faster-whisper 等，提供了丰富的选择和高质量的翻译与配音效果。
可完全离线：支持完全本地离线的视频翻译，确保用户在没有网络的情况下也能使用该软件，保护了用户的隐私和数据安全。
支持API调用：方便开发者将该软件的功能集成到其他应用程序中，增强了软件的可扩展性和实用性。

2.3.使用优势

免费+开源：pyVideoTrans 的代码在 GitHub 上开源，用户可以免费使用该软件，且没有任何功能限制，这使得用户可以根据自己的需求进行定制和优化。
操作简便：软件提供了直观的操作界面，用户无需复杂的设置和操作即可完成视频的翻译和配音工作。
高质量翻译与配音：通过集成多种先进的技术和工具，pyVideoTrans 能够提供高质量的翻译和配音效果，使翻译后的视频更加自然和流畅。

2.4.适用场景

个人用户：对于个人用户来说，pyVideoTrans 是一个非常实用的工具，可以帮助他们轻松地将自己喜欢的视频翻译成不同的语言，满足个人的学习和娱乐需求。
教育机构：教育机构可以利用该软件将教学视频翻译成多种语言，方便不同语言背景的学生学习和理解。
企业用户：企业可以使用 pyVideoTrans 将产品介绍、培训视频等翻译成不同的语言，以满足全球市场的需求，提升企业的国际竞争力。

3.pyVideoTrans下载地址

pyVideoTrans已经放在网盘中，有需要的小伙伴可以免费自取！

链接：

https://pan.baidu.com/s/1aKM1dpMV4vCisEvT5FCKmA?pwd=tbr9

4.pyVideoTrans安装教程

4.1.下载已经解压好的v3.59文件夹中直接双击sp.exe即可使用v3.60，注意下载到中文路径下

image.png

注意，如果你自己解压，两个压缩包都需要解压，解压好的3.60里面的所有文件拷贝到解压好的3.59中，直接替换已经存在的文件即可！

image.png

4.2.软件运行成功界面

image.png

5.pyVideoTrans视频翻译使用教程

image.png

5.1.选择需要翻译的原始视频

选择要处理的视频: 点击按钮，从电脑中选择一个或多个视频文件 (按住 Ctrl 键可多选)。
文件夹: 选中此复选框，可以选择一个文件夹，软件将批量翻译该文件夹下的所有视频文件。
清理已生成: 如果对同一个视频再次进行操作，默认会使用上次生成的缓存数据。如果需要重新生成所有文件，请选中此复选框。
保存到..: 点击按钮，选择翻译后文件的保存位置。默认保存在原始视频所在目录下的 _video_out 文件夹中。
仅保存视频: 翻译过程中会生成字幕文件、音频文件等中间文件。如果只需要最终的翻译视频，请选中此复选框。

5.2.设置翻译渠道

本软件会先将视频语音转换为字幕，然后再将字幕翻译成目标语言，翻译渠道用来完成字幕翻译工作。

翻译渠道: 选择字幕翻译渠道。
发音语言: 选择原始视频的人类说话语言。
目标语言: 选择需要翻译的目标语言。
网络代理: 如果使用需要 VPN 的翻译渠道 (例如 Google、OpenAI)，在此处填写代理 IP 和端口。

5.3.设置配音渠道

翻译后的字幕文件将使用所选配音渠道生成音频文件

配音渠道: 选择配音引擎。
试听配音: 试听选择的配音角色效果。
配音语速/音量/音调: 调整配音的语速、音量和音调。语速和音量设置值表示相对于默认值的百分比增减量。例如，语速 15 表示比正常语速快 15% (1.15 倍速)；音量 90 表示比正常音量高 90% (1.9 倍音量)。

5.4.设置语音识别

这是最重要的一步操作，将视频中的说话识别为文字并生成srt字幕

语音识别: 选择语音识别引擎，用于将视频语音转换为字幕。默认选择 faster-whisper，免费且可在本地运行。
选择模型: 如果使用 faster-whisper 或 openai-whisper，可以选择不同的模型。模型越大，准确度越高，但运行速度越慢，消耗的资源也越多。 软件默认只包含 tiny 和 medium 两个模型，其他模型需要单独下载。 推荐使用 large-v2 或 large-v3-turbo 模型，效果最佳 (需要英伟达显卡和 CUDA/cuDNN 支持)。
语音切割模式: 选择语音切割方式。建议使用默认的 整体识别 模式，效果更好。 均等分割 模式会将语音分割成时长相等的片段，仅在使用faster-whisper/openai-whisper时可用.
中文重新断句: 选中此选项，将使用阿里云的标点符号模型对中文进行重新断句，提高字幕质量。
语音降噪: 选中此选项，将使用阿里云的语音降噪模型对语音进行降噪处理，提高识别准确率。

5.5.设置同步对齐

由于不同语言的语速和长度不同，翻译后的配音时长可能与原始视频不一致。此部分用于调整字幕、配音和画面之间的同步。

视频延长: 如果配音时长超过原始视频时长，选中此选项将在视频末尾添加静止画面，使视频时长与配音时长匹配。
配音加速: 如果配音时长超过原始视频时长，选中此选项将加速配音，使其时长与视频时长匹配。(最大加速倍数为 3 倍，可在菜单 工具 -> 高级选项 中修改)
视频慢速: 如果配音时长超过原始视频时长，选中此选项将降低视频播放速度，使其时长与配音时长匹配。(最大慢放倍数为 20 倍，可在菜单 工具 -> 高级选项 中修改)
字幕嵌入: 选择字幕嵌入方式。
- 不嵌入字幕: 不在视频中嵌入字幕。
- 嵌入硬字幕: 将字幕永久嵌入到视频中，在任何播放器中都能显示。
- 嵌入软字幕: 将字幕作为独立文件与视频一起保存，需要播放器支持才能显示。
- 嵌入硬字幕(双): 嵌入原始语言和目标语言两种硬字幕。
- 嵌入软字幕(双): 嵌入原始语言和目标语言两种软字幕。
中日韩单行字符: 设置嵌入硬字幕时，中日韩语言每行字幕的最大字符数 (默认 20)。
其他语言: 设置嵌入硬字幕时，其他语言每行字幕的最大字符数 (默认 60)。

5.6.处理背景音

保留原始背景音: 选中此选项，将在翻译后的视频中保留原始背景音乐。注意：此选项会显著增加处理时间和系统资源消耗，并提高字幕生成的准确度。
添加额外背景音频: 点击按钮，选择一个音频文件作为新的背景音乐。
循环背景音: 如果新的背景音乐时长短于视频时长，选中此选项将循环播放背景音乐。
背景音量: 调整背景音乐的音量。值小于 1 为降低音量，大于 1 为提高音量。

5.7.开始执行

CUDA加速: 如果你有英伟达显卡并安装了 CUDA/cuDNN，选中此选项可以大幅提高翻译速度。

点击 开始执行 按钮，软件将开始翻译视频。

image.png

5.8.查看翻译结果

翻译完成后，点击进度条可以打开结果所在的文件夹。翻译后的视频文件为 MP4 格式，其他文件是中间生成的素材文件 (例如 SRT 字幕文件、音频文件)。

image.png

更多功能教程可以查看官方文档： https://pyvideotrans.com/getstart

image.png

更多模型，考虑到很多小伙伴可能由于网络原因，无法下载模型，我这边也提前下载整理好了模型放到网盘中了，供给位小伙伴更加便捷使用！

6.结语

免责声明：

**版权：**我们作为资源的整理方，所有资源均来自互联网的优秀作者们，版权归原作者所有！如果侵犯到您的权益，请联系我本人，提供可充分证明权益的有效文件，我们会第一时间配合处理！

**说明：**资源由全网公开平台资源、圈子社群分享资源、和部分本人原创资源组成，仅供个人学习研究交流使用，除特别声明外，请勿用于商业用途，禁止用于非法用途，使用者需要自行承担法律责任，使用者需严格遵守国家法律法规。否则产生的一切后或由您自行承担，我们提供资源但是不对任何资源负法律责任，所有资源请在您下载后24小时删除！

**声明：**任何使用本人收集的资源产生的不测后果，本人不对此负任何责任！转载时请保留本信息，感谢！

附：

根据二00二年一月一日《计算机软件保护条例》第十七条规定：为了学习和研究软件内含的设计思想和原理，通过安装、显示、传输或者存储软件等方式使用软件的，可以不经软件著作权人许可，不向其支付报酬!

鉴于此，也希望大家按此说明学习和研究软件!谢谢!

寄语：愿我们在这充满机遇与挑战的Ai智能时代，勇敢探索，不断创新，收获无限可能与惊喜！！！