突破压缩极限的AI语音编解码器

非典型废言

已于 2023-10-15 16:07:59 修改

阅读量613

点赞数 1

分类专栏：语音信号处理文章标签：深度学习人工智能

于 2023-02-14 22:54:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_35821976/article/details/129035112

版权

语音信号处理专栏收录该内容

51 篇文章 25 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

I. Speech Codecs

语音编码的目的是在保持语音质量的前提下尽可能地减少传输所用的带宽，主要是利用人的发声过程中存在的冗余度和人的听觉特性达到压缩的目的。经过了多年的发展，目前语音编解码器大致可以分为以下几类：

波形编码，将时域波形经过采样量化编码，常见的就是PCM编码格式

参数编码，根据人的发声机制建立数学模型，然后对语音进行压缩，常见的是LPC-10

混合编码，结合波形编码和参数编码的压缩方式，常见的AMR等

深度学习编码，利用神经网络将语音编码成隐向量，然后利用神经网络将其恢复成语音信息，微软的Satin以及今天要介绍的Lyra就是其代表

虽然目前很多领域仍是直接把PCM封装成IP包进行传输，但是在带宽限制的领域，如VoIP语音会议，语音编解码是较为关键的技术之一。

II. Lyra

Lyra去年就已经在Github上开源了，并且同时支持Linux和A

了解本专栏

超级会员免费看

非典型废言

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
突破压缩极限的AI语音编解码器

语音编码的目的是在保持语音质量的前提下尽可能地减少传输所用的带宽，主要是利用人的发声过程中存在的冗余度和人的听觉特性达到压缩的目的。经过了多年的发展，目前语音编解码器大致可以分为以下几类：
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。