1.近来想做一点音频降噪的事情。原由是我们单位经常要录制1分钟至3分钟的短视频,但是录制环境有比较强的设备噪音,导致人声稍微弱一点。之前声像老师试了很多办法,包括使用常用的软件、请教电视台专业技术人员等,发现降噪后会改变人声的音色,因此也就放弃了降噪处理。所以我想着能否通过深度学习或者大模型实现降噪。
2.简单搜了下,发现python里常用的音频处理包是librosa,所以就使用pip install librosa,安装了这个包。但是使用librosa.load函数加载mp3音频时没有反应,就开始了好几天的困惑之旅。事后总结,主要是ffmpeg没有安装,主要原因如下:
librosa
无法直接读取 mp3 文件,因此它尝试使用audioread
包裹。Audioread
尝试使用许多不同的软件包,这些软件包可能已安装,也可能未安装。其中之一是ffmpeg
.- 但是它使用
FFmpeg
'通过其命令行界面'。我想这就是pip
的原因安装 FFmpeg 不起作用。它需要ffmpeg.exe
文件。 - 您可以下载
ffmpeg
installer from here - 安装后确保您可以启动
ffmpeg
从命令行(输入ffmpeg -h
)。您可能需要将安装文件夹的路径(例如c:\ffmpeg\bin
)添加到 Windows 路径中。 - 最后,确保重新启动您的 IDE。 Visual Studio Code 可能在重置后才能识别新路径。
主要参考了这个:python - audioread.exceptions.NoBackendError in librosa - Stack Overflow
3.在这个过程还发生了很多错误,最后通过重装annaconda进行了解决。
4.目前在读取MP3时还有error:Giving up searching valid MPEG header after 65536 bytes of junk.的错误,还没找到原因。有大佬知道的话,麻烦指点一下。