- 博客(3)
- 收藏
- 关注
原创 SoundStream论文阅读
nn可以通过音频超分辨率,即扩展频率带宽,通过音频降噪,即去除有损编码伪影,或通过数据包丢失隐藏,来将它们用作后处理步骤以提高现有编解码器的质量。还有一些nn的vocoder,比如wavenet,lpcnet,wavernn已经应用在了语音合成领域。也是我们通常所用说的K-means算法最常见的实现方式。下图表明了soundstream相比其他的编解码方式,达到了sota的效果,在中低比特率下,也能重建出高音质的音频。而参数编码器通常会有比较强的先验假设,通过估计参数,来重构听感上相似的音频。
2023-12-03 16:53:24 405 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人