从Satin到Lyra 为何微软、谷歌都盯向音频编解码器?

微软发布了Satin,一款基于AI的音频编解码器,可在高丢包率下提供良好音质,支持超宽带语音。谷歌则推出了Lyra,能在3kbps带宽下实现清晰语音通信。Satin侧重超宽带和丢包恢复,而Lyra专注窄带。两者均为AI驱动,但结构不同,Satin为混合型,Lyra为全AI结构。
摘要由CSDN通过智能技术生成

回顾今年的2月份,可以说是音频编解码器最为热闹的一个月。先是微软宣布推出最新款由AI支持的音频编解码器——Satin。仅一周后,谷歌推出了用于语音压缩的新型超低比特率音频编解码器——Lyra,并且Android版本已开源。在此,也非常感谢来自国内音频领域的知名业内人士对本文发表评论及审校。

整理 / LiveVideoStack

不难发现,硅谷大佬们对音频编解码器的深度研发进度已提上日程,对未来可应用的场景让人们充满期待。值得注意的是这两款音频编解码器都是基于AI的语音编码,但它们又有各自不同的特点。

Satin:用于实时通信的AI音频编解码器 

作为一款由人工智能驱动的音频编解码器,Satin可以在网速6kbps时提供超宽频段的语音,17kbps时提供全频段的立体声音乐,网速越高,质量越高。Satin旨在高丢包率下也提供良好的音频质量。此外,在冗余算法的改进下,可以应对突发丢包情况,提供更好的保护。以下是经过改进的弹性算法和Satin编解码器的最终效果:

SILK@6kbps,突发数据包丢失(附加6kbps的冗余)

Satin@6kbps,突发数据包丢失,改进的冗余算法(附加6kbps的冗余)

相对于Silk推出的超宽带语音,12kHz的频率,以24kHz的采样率(在人类声音超过12kHz的频率时,能量会迅速下降)&#x

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值