Ai视频翻译神器来袭!pyVideoTrans一键搞定字幕与配音,免费开源

1.前言

各位小伙伴们,大家好呀!欢迎关注 天夏Ai,全网同名,我们致力于为大家挖掘和分享各种 精品实用的人工智能(Ai)资源,包括但不限于**:Ai黑科技工具软件、Ai副业创业项目、Ai智能硬件设备!**
  • **Ai 黑科技工具软件:**这些软件拥有强大的功能和创新的算法,无论是提升工作效率,还是满足个人兴趣爱好,都能为你提供独特的解决方案,让你在使用过程中感受到科技的魅力与力量。
  • **Ai 副业创业项目:**如果你正在寻找新的发展机会,我们的Ai副业创业项目或许能为你打开一扇新的大门。这些项目结合了当下热门的人工智能技术与市场需求,为你提供可行的商业模式和操作指南,助力你在创业的道路上迈出坚实的一步。
  • **Ai 智能硬件设备:**这些智能硬件设备在Ai绘画、Ai问答、Ai音频和Ai视频等多个领域发挥着重要作用,为用户提供了强大的计算能力和高效的数据处理能力,极大地提升了创作和处理效率。

无论你是科技爱好者,还是想要在事业上寻求突破,天夏Ai 都将是你的不二之选。在这里,你将发现人工智能的无限可能,获取更多精品实用的Ai资源,开启一段精彩的科技之旅。

2.pyVideoTrans介绍

pyVideoTrans 是一款开源免费的视频翻译配音软件,旨在帮助用户轻松地将视频内容从一种语言转换为另一种语言,并生成带有字幕和配音的新视频。用户可以免费下载和使用,无需登录或注册。

image.png

2.1.核心功能

  • 视频翻译:它能够识别原视频中的说话声,并自动生成字幕,然后翻译为目标语言字幕,接着为目标语言字幕配音生成音频,再将配音音频、目标语言字幕同原始视频合并,生成新的视频,从而实现视频翻译。
  • 语音识别转录:支持批量将音频或视频文件转录为SRT字幕
  • SRT字幕翻译:可将SRT字幕保持原格式和时间戳的前提下翻译为其他语言
  • 为字幕或文字配音:为SRT字幕或文字生成配音,支持多种配音渠道

此外还有 音频视频字幕合并、批量视频音频合并、批量视频字幕合并、人声背景音分离等辅助功能。

2.2.技术特点

  • 多种语音识别/配音/翻译渠道:集成了多种主流的语音识别、文字配音和翻译技术,包括 edgeTTS、Azure、OpenAI、GPT-SoVITS、Gemini 和 faster-whisper 等,提供了丰富的选择和高质量的翻译与配音效果。
  • 可完全离线:支持完全本地离线的视频翻译,确保用户在没有网络的情况下也能使用该软件,保护了用户的隐私和数据安全。
  • 支持API调用:方便开发者将该软件的功能集成到其他应用程序中,增强了软件的可扩展性和实用性。

2.3.使用优势

  • 免费+开源:pyVideoTrans 的代码在 GitHub 上开源,用户可以免费使用该软件,且没有任何功能限制,这使得用户可以根据自己的需求进行定制和优化。
  • 操作简便:软件提供了直观的操作界面,用户无需复杂的设置和操作即可完成视频的翻译和配音工作。
  • 高质量翻译与配音:通过集成多种先进的技术和工具,pyVideoTrans 能够提供高质量的翻译和配音效果,使翻译后的视频更加自然和流畅。

2.4.适用场景

  • 个人用户:对于个人用户来说,pyVideoTrans 是一个非常实用的工具,可以帮助他们轻松地将自己喜欢的视频翻译成不同的语言,满足个人的学习和娱乐需求。
  • 教育机构:教育机构可以利用该软件将教学视频翻译成多种语言,方便不同语言背景的学生学习和理解。
  • 企业用户:企业可以使用 pyVideoTrans 将产品介绍、培训视频等翻译成不同的语言,以满足全球市场的需求,提升企业的国际竞争力。

3.pyVideoTrans下载地址

pyVideoTrans已经放在网盘中,有需要的小伙伴可以免费自取!

链接:

https://pan.baidu.com/s/1aKM1dpMV4vCisEvT5FCKmA?pwd=tbr9

4.pyVideoTrans安装教程

4.1.下载已经解压好的v3.59文件夹中直接双击sp.exe即可使用v3.60,注意下载到中文路径下

image.png

注意,如果你自己解压,两个压缩包都需要解压,解压好的3.60里面的所有文件拷贝到解压好的3.59中,直接替换已经存在的文件即可!

image.png

image.png

4.2.软件运行成功界面

image.png

5.pyVideoTrans视频翻译使用教程

image.png

5.1.选择需要翻译的原始视频

  • 选择要处理的视频: 点击按钮,从电脑中选择一个或多个视频文件 (按住 Ctrl 键可多选)。
  • 文件夹: 选中此复选框,可以选择一个文件夹,软件将批量翻译该文件夹下的所有视频文件。
  • 清理已生成: 如果对同一个视频再次进行操作,默认会使用上次生成的缓存数据。如果需要重新生成所有文件,请选中此复选框。
  • 保存到..: 点击按钮,选择翻译后文件的保存位置。默认保存在原始视频所在目录下的 _video_out 文件夹中。
  • 仅保存视频: 翻译过程中会生成字幕文件、音频文件等中间文件。如果只需要最终的翻译视频,请选中此复选框。

5.2.设置翻译渠道

本软件会先将视频语音转换为字幕,然后再将字幕翻译成目标语言,翻译渠道用来完成字幕翻译工作。

  • 翻译渠道: 选择字幕翻译渠道。
  • 发音语言: 选择原始视频的人类说话语言。
  • 目标语言: 选择需要翻译的目标语言。
  • 网络代理: 如果使用需要 VPN 的翻译渠道 (例如 Google、OpenAI),在此处填写代理 IP 和端口。

5.3.设置配音渠道

翻译后的字幕文件将使用所选配音渠道生成音频文件

  • 配音渠道: 选择配音引擎。
  • 试听配音: 试听选择的配音角色效果。
  • 配音语速/音量/音调: 调整配音的语速、音量和音调。 语速和音量设置值表示相对于默认值的百分比增减量。例如,语速 15 表示比正常语速快 15% (1.15 倍速);音量 90 表示比正常音量高 90% (1.9 倍音量)。

5.4.设置语音识别

这是最重要的一步操作,将视频中的说话识别为文字并生成srt字幕

  • 语音识别: 选择语音识别引擎,用于将视频语音转换为字幕。 默认选择 faster-whisper,免费且可在本地运行。
  • 选择模型: 如果使用 faster-whisper 或 openai-whisper,可以选择不同的模型。模型越大,准确度越高,但运行速度越慢,消耗的资源也越多。 软件默认只包含 tiny 和 medium 两个模型,其他模型需要单独下载。 推荐使用 large-v2 或 large-v3-turbo 模型,效果最佳 (需要英伟达显卡和 CUDA/cuDNN 支持)。
  • 语音切割模式: 选择语音切割方式。建议使用默认的 整体识别 模式,效果更好。 均等分割 模式会将语音分割成时长相等的片段, 仅在使用faster-whisper/openai-whisper时可用.
  • 中文重新断句: 选中此选项,将使用阿里云的标点符号模型对中文进行重新断句,提高字幕质量。
  • 语音降噪: 选中此选项,将使用阿里云的语音降噪模型对语音进行降噪处理,提高识别准确率。

5.5.设置同步对齐

由于不同语言的语速和长度不同,翻译后的配音时长可能与原始视频不一致。 此部分用于调整字幕、配音和画面之间的同步。

  • 视频延长: 如果配音时长超过原始视频时长,选中此选项将在视频末尾添加静止画面,使视频时长与配音时长匹配。
  • 配音加速: 如果配音时长超过原始视频时长,选中此选项将加速配音,使其时长与视频时长匹配。(最大加速倍数为 3 倍,可在菜单 工具 -> 高级选项 中修改)
  • 视频慢速: 如果配音时长超过原始视频时长,选中此选项将降低视频播放速度,使其时长与配音时长匹配。(最大慢放倍数为 20 倍,可在菜单 工具 -> 高级选项 中修改)
  • 字幕嵌入: 选择字幕嵌入方式。
    • 不嵌入字幕: 不在视频中嵌入字幕。
    • 嵌入硬字幕: 将字幕永久嵌入到视频中,在任何播放器中都能显示。
    • 嵌入软字幕: 将字幕作为独立文件与视频一起保存,需要播放器支持才能显示。
    • 嵌入硬字幕(双): 嵌入原始语言和目标语言两种硬字幕。
    • 嵌入软字幕(双): 嵌入原始语言和目标语言两种软字幕。

  • 中日韩单行字符: 设置嵌入硬字幕时,中日韩语言每行字幕的最大字符数 (默认 20)。
  • 其他语言: 设置嵌入硬字幕时,其他语言每行字幕的最大字符数 (默认 60)。

5.6.处理背景音

  • 保留原始背景音: 选中此选项,将在翻译后的视频中保留原始背景音乐。注意:此选项会显著增加处理时间和系统资源消耗,并提高字幕生成的准确度。
  • 添加额外背景音频: 点击按钮,选择一个音频文件作为新的背景音乐。
  • 循环背景音: 如果新的背景音乐时长短于视频时长,选中此选项将循环播放背景音乐。
  • 背景音量: 调整背景音乐的音量。 值小于 1 为降低音量,大于 1 为提高音量。

5.7.开始执行

  • CUDA加速: 如果你有英伟达显卡并安装了 CUDA/cuDNN,选中此选项可以大幅提高翻译速度。

点击 开始执行 按钮,软件将开始翻译视频。

image.png

5.8.查看翻译结果

翻译完成后,点击进度条可以打开结果所在的文件夹。 翻译后的视频文件为 MP4 格式,其他文件是中间生成的素材文件 (例如 SRT 字幕文件、音频文件)。

image.png

更多功能教程可以查看官方文档: https://pyvideotrans.com/getstart

image.png

更多模型,考虑到很多小伙伴可能由于网络原因,无法下载模型,我这边也提前下载整理好了模型放到网盘中了,供给位小伙伴更加便捷使用!

6.结语

免责声明:

**版权:**我们作为资源的整理方,所有资源均来自互联网的优秀作者们,版权归原作者所有!如果侵犯到您的权益,请联系我本人,提供可充分证明权益的有效文件,我们会第一时间配合处理!

**说明:**资源由全网公开平台资源、圈子社群分享资源、和部分本人原创资源组成,仅供个人学习研究交流使用,除特别声明外,请勿用于商业用途,禁止用于非法用途,使用者需要自行承担法律责任,使用者需严格遵守国家法律法规。否则产生的一切后或由您自行承担,我们提供资源但是不对任何资源负法律责任,所有资源请在您下载后24小时删除!

**声明:**任何使用本人收集的资源产生的不测后果,本人不对此负任何责任!转载时请保留本信息,感谢!


附:

根据二00二年一月一日《计算机软件保护条例》第十七条规定:为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬!

鉴于此,也希望大家按此说明学习和研究软件!谢谢!


寄语:愿我们在这充满机遇与挑战的Ai智能时代,勇敢探索,不断创新,收获无限可能与惊喜!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值