文章目录
1.定义
DCT(Discrete Cosine Transform)离散余弦变换,其常见用途是对音视频进行数据压缩。离散余弦变换具有信号谱分量丰富、能量集中,且不需要对语音相位进行估算等优点,能在较低的运算复杂度下取得较好的语音增强效果。
维基百科上的解释:DCT以不同频率振荡的余弦函数之和来表示数据点的有限序列。
1.信号常将其能量的大部分集中于频率域的一个小范围内,这样一来,描述不重要的分量 只需要很少的比特数;
2.频率域分解映射了人类视觉系统的处理过程,并允许后继的量化过程满足其灵敏度的要求。
余弦函数是傅里叶变换中的实数部分。DCT与DFT(离散傅里叶变换)联系紧密。
设x(n) 是N 个有限值的一维实数信号序列, n = 0,l, …,N - 1, DCT 的完备正交归一
函数是
X ( k ) = a ( k ) ∑ n = 0 N − 1 x ( n ) cos [ π ( 2 n + 1 ) k 2 N ] x ( n ) = ∑ k = 0 N − 1 a ( k ) X ( k ) cos [ π ( 2 n + 1 ) k 2 N ] \begin{aligned} X(k) &=a(k) \sum_{n=0}^{N-1} x(n) \cos \left[\frac{\pi(2 n+1) k}{2 N}\right] \\ x(n) &=\sum_{k=0}^{N-1} a(k) X(k) \cos \left[\frac{\pi(2 n+1) k}{2 N}\right] \end{aligned} X(k)x(n)=a(k)n=0∑N−1x(n)cos[2Nπ(2n+1)k]=k=0∑N−1a(k)X(k)cos[2Nπ(2n+1)k]
式中, a(k) 的定义为
a ( k ) = { 1 / N k = 0 2 / N 1 ⩽ k ⩽ N − 1 a(k)=\left\{\begin{array}{ll}{\sqrt{1 / N}} & {k=0} \\ {\sqrt{2 / N}} & {1 \leqslant k \leqslant N-1}\end{array}\right. a(k)={