VoiceFixer 2：用于语音恢复的工具包-CSDN博客

本文链接：https://blog.csdn.net/AI_SHELL/article/details/135086667

本文介绍了VoiceFixer2，新一代的语音修复工具，集成了AI技术，能修复背景噪音、改善音频质量。与旧版不同，VoiceFixer2解决了兼容性问题，新增了MPS支持、GPU加速及对非WAV文件的支持。用户可以选择安装软件包或使用免费API进行试用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目简介

欢迎使用 VoiceFixer 2，下一代 VoiceFixer。VoiceFixer 是一款通用语音修复工具，使用 AI 消除背景噪音、修复降级语音、增强旧录音的音频质量、提高音频分辨率等等，全部功能都在一个模型中！

VoiceFixer 的目标是恢复人类语音，无论其退化有多严重。它可以在一个模型内处理噪声、混响、低分辨率和削波效果！

与原来的 VoiceFixer 有什么不同？

VoiceFixer 的原始版本继续更新，进行了细微的更改和错误修复，但是，如果尝试安装它并开箱即用，则会遇到一些错误，需要修改已安装的软件包才能修复。

有什么问题？这是如何解决的？VoiceFixer 需要旧版本的 librosa 库，该库与新版本的 numpy 库不兼容。我们通过修复旧版本的 librosa 和 voicefixer 解决了这个问题。我们还添加了一些新功能。

VoiceFixer 2 中的新功能

我们在 VoiceFixer 2 中添加了以下功能：

我们添加了 MPS 支持，这意味着您可以在 M1 Mac 上使用 GPU 加速。您可以通过将 cuda 参数设置为 True 来启用此功能。使用命令行界面 (CLI) 时会自动启用它。
我们通过 TQDM 添加了进度条以获取更长的音频
我们现在支持非 WAV 文件（即 MP3）
我们现在使用 cached_path 而不是硬编码缓存路径来增加操作系统支持
我们提供更快的模型下载和 Hugging Face
更多功能即将推出！

安装

不想安装该软件包，但只想尝试一下？

使用我们的免费 API（无需 API 密钥）处理 5 分钟以内的音频文件。仅限非商业用途，可能会收集音频。详情见网页。

curl -X POST -H "Content-Type: multipart/form-data" -F "file=@test.mp3" https://voicefixer-voicefixer-api.hf.space/process_audio > processed_audio.wav

注意：如果您在 Apple Silicon 上有任何问题，请安装 PyTorch Nightly ( pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu )

您可以通过安装我们的软件包。PyPI（Python Package Index），官方 Python 包索引。

pip install voicefixer2

这将安装最新发布的版本。

如果您想安装最新的开发版本，或者出于任何原因不信任 PyPI，请直接从源安装：

pip install git+https://github.com/fakerybakery/voicefixer

项目链接

https://github.com/voicefixer/voicefixer