离散余弦变换/Discrete cosine transform,
根据离散傅里叶变换的性质,实偶函数的傅里叶变换只含实的余弦项,而数字图像都是实数矩阵,因此构造了一种实数域的变换——离散余弦变换(DCT)。
离散余弦变换具有很强的”能量集中”特性,左上方称为低频数据,右下方称为高频数据。而大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分。因此也可以在图像压缩算法中用来进行有损压缩。(如JPEG压缩编码)
OpenCV中dct()
在OpenCV中有专门进行离散余弦变换的函数dct()。
dct()函数执行1D或2D浮点数组的正向或反向离散余弦变换(DCT):
N个元素的一维向量的正余弦变换:
Y=C(N)⋅X
Y
=
C
(
N
)
⋅
X
此处
C(N)jk=αj/N−−−−−√cos(π(2k+1)j2N)
C
j
k
(
N
)
=
α
j
/
N
cos
(
π
(
2
k
+
1
)
j
2
N
)
;
αj=2
α
j
=
2
,
j>0
j
>
0
- N个元素的一维矢量的逆余弦变换:
X=(C(N))−1⋅Y=(C(N))T⋅YC(N) X = ( C ( N ) ) − 1 ⋅ Y = ( C ( N ) ) T ⋅ Y C ( N )
由于 C(N) C ( N ) 是一个正交矩阵,因此 C(N)⋅(C(N))T=I C ( N ) ⋅ ( C ( N ) ) T = I - M×N矩阵的正向2D余弦变换:
Y=C(N)⋅X⋅(C(N))T Y = C ( N ) ⋅ X ⋅ ( C ( N ) ) T - M×N矩阵的逆二维余弦变换:
X=(C(N))T⋅X⋅C(N) X = ( C ( N ) ) T ⋅ X ⋅ C ( N )
该函数通过查看输入数组的标志和大小来选择操作模式:
- 如果(flags&DCT_INVERSE)== 0,则函数执行向前的1D或2D变换。否则是一个逆1D或2D变换。
- 如果(flags&DCT_ROWS)!= 0,则函数执行每行的一维变换。
- 如果数组是单列或单行,则该函数执行一维变换。
- 如果以上都不是,则该函数执行2D变换。
目前dct支持偶数大小的数组(2,4,6 …)。对于数据分析和逼近,可以在必要时填充数组。另外,函数性能对数组大小的依赖性非常大,而不是单调的。在当前实现中,大小为N的矢量的DCT通过大小为N / 2的矢量的DFT来计算。因此,最佳DCT大小N1 > = N可以计算为:
size_t getOptimalDCTSize(size_t N){return 2 * getOptimalDFTSize((N + 1)/ 2); }
N1 = getOptimalDCTSize(N);
dct()参数
- src 输入浮点数组。
- dst 输出与src大小和类型相同的数组。
- flags 转换标志
opencv示例
#include <opencv2\opencv.hpp>
#include <opencv2\core\core.hpp>
#include <opencv2\core\mat.hpp>
#include <iostream>
using namespace std;
using namespace cv;
int main()
{
Mat src = imread("E:\\image\\sophie.jpg", 0);
if(src.empty())
{
cout << "the image is not exist" << endl;
return -1;
}
resize(src, src, Size(512, 512));
src.convertTo(src, CV_32F, 1.0/255);
Mat srcDCT;
dct(src, srcDCT);
imshow("src", src);
imshow("dct", srcDCT);
waitKey();
return 0;
}
可以看到因为第一幅图像的细节较少,因此DFT变换数据主要集中在左上方(低频区域),高频区域大部分为0:
而第二幅图像相对而言具有较为丰富的细节,因此相对于第一幅图像中间区域出现了大量的非0值: