音频压缩编码概述

什么是音频信号

通常,将人耳可以听到的信号,叫做音频信号(20Hz-20kHz)。

  • 人的发声器官能产生的频段在80-3400Hz左右。
  • 正常人说话的语音频段在300-3000Hz左右。

人耳听觉系统三特性

  1. 人耳对不同频率的灵敏度不同。在2-5KHz的频段信息很容易被人耳听到。
  2. 频率遮蔽效应(FME)。高频信息和低频信息同时出现时,很难听出低频信息。
  3. 时域遮蔽效应(TME)。强信号出现时刻附近的弱信号,很难被听出。

音频编码技术概览

一般,将音频信息分为语音信息和音乐信息两类。

语音的编码技术包括波形编码、参数编码、混合编码等。

音乐的编码技术包括心理声学模型、自适应变换编码、霍夫曼编码等。

波形编码

缩写全称释义
PCMPulse Code Modulation脉冲编码调制
DPCMDifferential Pulse Code Modulation差分脉冲编码调制
APCMAdaptive Pulse Code Modulation自适应脉冲编码调制
ADPCMAdaptive Differential Pulse Code Modulation自适应差分脉冲编码调制

PCM与DPCM的区别:

  • PCM对采样信号进行量化编码。
  • DPCM对实际信号值与预测信号值之差进行量化编码。

ADPCM核心思想:

  • 对差值进行编码预测。
  • 非均匀量化,大量化阶适应大差值,小量化阶适应小差值。

参数编码

缩写全称释义
LPCLinear Predictive Coding线性预测编码

混合编码

缩写全称释义
MP-LPCMulti-Pulse-Linear Predictive Coding多脉冲激励线性预测编码
RP-LPCRegular Pulse Excited-Linear Predictive Coding规划脉冲激励线性预测编码
CELPCode Excited Linear Prediction码本激励线性预测编码

感知编码

感知编码器根据可听度来分配所使用的字长,即根据人耳灵敏度进行编码。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值