1、关于rnnoise ,因为语音增强大部分场景都是16k,所以很多人的就会想要16k 的模型,而作者提供的是48k的模型,
那到底有没有必要从新训练成16k 的呢?
优点:
a、我们先来分析一下代码结构,从48k 降低到16k,fft 可以从960 降低到320,其他代码基本不会有效率上的减少。
b、可以减少一次上采样到48k以及一次下采样16k。
缺点:
a、pitch 滤波提高基音谐波造成的噪声抑制减弱能力降低,fft后的分辨率下降,导致算法的效果降低。
结论:如果对效率不是那么追求的应用,最好还是使用48k来处理!
rnnoise 具体训练、应用,测试,技术优化,欢迎大家加音频算法讨论群:153268894 (作者 zeark)。