音频压缩编码概述

最新推荐文章于 2024-08-19 15:35:10 发布

Dormine

最新推荐文章于 2024-08-19 15:35:10 发布

阅读量846

点赞数 1

文章标签：语音识别概率论信号处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-NC-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Differoucius/article/details/121406436

版权

音频压缩编码概述

什么是音频信号

通常，将人耳可以听到的信号，叫做音频信号(20Hz-20kHz)。

人的发声器官能产生的频段在80-3400Hz左右。
正常人说话的语音频段在300-3000Hz左右。

人耳听觉系统三特性

人耳对不同频率的灵敏度不同。在2-5KHz的频段信息很容易被人耳听到。
频率遮蔽效应(FME)。高频信息和低频信息同时出现时，很难听出低频信息。
时域遮蔽效应(TME)。强信号出现时刻附近的弱信号，很难被听出。

音频编码技术概览

一般，将音频信息分为语音信息和音乐信息两类。

语音的编码技术包括波形编码、参数编码、混合编码等。

音乐的编码技术包括心理声学模型、自适应变换编码、霍夫曼编码等。

波形编码

缩写	全称	释义
PCM	Pulse Code Modulation	脉冲编码调制
DPCM	Differential Pulse Code Modulation	差分脉冲编码调制
APCM	Adaptive Pulse Code Modulation	自适应脉冲编码调制
ADPCM	Adaptive Differential Pulse Code Modulation	自适应差分脉冲编码调制

PCM与DPCM的区别：

PCM对采样信号进行量化编码。
DPCM对实际信号值与预测信号值之差进行量化编码。

ADPCM核心思想：

对差值进行编码预测。
非均匀量化，大量化阶适应大差值，小量化阶适应小差值。

参数编码

缩写	全称	释义
LPC	Linear Predictive Coding	线性预测编码

混合编码

缩写	全称	释义
MP-LPC	Multi-Pulse-Linear Predictive Coding	多脉冲激励线性预测编码
RP-LPC	Regular Pulse Excited-Linear Predictive Coding	规划脉冲激励线性预测编码
CELP	Code Excited Linear Prediction	码本激励线性预测编码

感知编码

感知编码器根据可听度来分配所使用的字长，即根据人耳灵敏度进行编码。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。