Lyra编码器基础环境搭建

Lyra介绍

Google最近开源了一种语音压缩的新型超低比特率编解码器,这种编码器的最大特点是基于机器学习原理,能够使用最少的数据来重建语音,这是和传统AAC和Opus编码原理的本质区别,这种基于机器学习的编码思想也逐渐应用的图像编码和视频编码上。

其次Lyra牛逼的地方在于不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

随着谷歌的推广,估计WebRTC后续也有相关动作支持起来,特别在网络比较差带宽较低的场景下进行实时音视频互动有一定的优势。目前已经在Google Duo中进行了应用。

Lyra代码使用C ++编写,以实现速度,效率和互操作性,并使用带有Abseil的Bazel构建框架和用于全面单元测试的GoogleTest框架。核心API提供了用于在文件和数据包级别进行编码和解码的接口。还提供了完整的信号处理工具链,其中包括各种滤波器和变换
在这里插入图片描述

Google Lyra是一种基于生成模型的新语音压缩方法,通过极大地提高原始语音的声音质量(即大约需要8-16 kbps),可以仅以3 kbps的低带宽获得透明质量
语音压缩具有与音频压缩,图像压缩和视频压缩不同的特征。例如,音频压缩已经演变成一种模型化人耳特性的方法,而不是声源生成模型,而是听觉模型,因为它必须处理多种声源结合在一起的形式。图像压缩部分反映了低频成分比高频成分在视觉上更敏感的视觉特征,但是它没有积极地利用语音压缩或音频压缩等认知特征。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值