VoiceFixer 2:用于语音恢复的工具包

本文介绍了VoiceFixer2,新一代的语音修复工具,集成了AI技术,能修复背景噪音、改善音频质量。与旧版不同,VoiceFixer2解决了兼容性问题,新增了MPS支持、GPU加速及对非WAV文件的支持。用户可以选择安装软件包或使用免费API进行试用。
摘要由CSDN通过智能技术生成

项目简介

欢迎使用 VoiceFixer 2,下一代 VoiceFixer。VoiceFixer 是一款通用语音修复工具,使用 AI 消除背景噪音、修复降级语音、增强旧录音的音频质量、提高音频分辨率等等,全部功能都在一个模型中!

VoiceFixer 的目标是恢复人类语音,无论其退化有多严重。它可以在一个模型内处理噪声、混响、低分辨率和削波效果!


与原来的 VoiceFixer 有什么不同?

VoiceFixer 的原始版本继续更新,进行了细微的更改和错误修复,但是,如果尝试安装它并开箱即用,则会遇到一些错误,需要修改已安装的软件包才能修复。

有什么问题?这是如何解决的?VoiceFixer 需要旧版本的 librosa 库,该库与新版本的 numpy 库不兼容。我们通过修复旧版本的 librosa 和 voicefixer 解决了这个问题。我们还添加了一些新功能。


VoiceFixer 2 中的新功能

我们在 VoiceFixer 2 中添加了以下功能:

  • 我们添加了 MPS 支持,这意味着您可以在 M1 Mac 上使用 GPU 加速。您可以通过将 cuda 参数设置为 True 来启用此功能。使用命令行界面 (CLI) 时会自动启用它。

  • 我们通过 TQDM 添加了进度条以获取更长的音频

  • 我们现在支持非 WAV 文件(即 MP3)

  • 我们现在使用 cached_path 而不是硬编码缓存路径来增加操作系统支持

  • 我们提供更快的模型下载和 Hugging Face

  • 更多功能即将推出!

安装

不想安装该软件包,但只想尝试一下?

使用我们的免费 API(无需 API 密钥)处理 5 分钟以内的音频文件。仅限非商业用途,可能会收集音频。详情见网页。

curl -X POST -H "Content-Type: multipart/form-data" -F "file=@test.mp3" https://voicefixer-voicefixer-api.hf.space/process_audio > processed_audio.wav

注意:如果您在 Apple Silicon 上有任何问题,请安装 PyTorch Nightly ( pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu )

您可以通过安装我们的软件包。PyPI(Python Package Index),官方 Python 包索引。

pip install voicefixer2

这将安装最新发布的版本。

如果您想安装最新的开发版本,或者出于任何原因不信任 PyPI,请直接从源安装:

pip install git+https://github.com/fakerybakery/voicefixer

项目链接

https://github.com/voicefixer/voicefixer

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值