西安邮电大学的《视频压缩通信》作为视频编码的入门课程,具有一定的参考价值。
视频压缩通信MOOC:
https://www.icourse163.org/course/XIYOU-1205808809
视频图像基础知识
-
AD转换
-
人眼感受光强公式:f(x,y) = ∫A(x,y,λ)E(λ)dλ
-
面向用户的图像格式HSV
H:hue 色度
S:saturation 饱和度
V:value 亮度
-
欧洲电视标准:YUV(YCrCb)
视频图像质量评价
-
人眼观感:马赫效应、掩盖效应
-
均方误差:MSE(mean square error)
-
信噪比:SNR = 10 log (图像平均能量/MSE)
-
峰值信噪比:PSNR = 10 log(255²/MSE)
-
MOS:mean opinion score
-
SSIM:结构相似性索引(按区域)
-
JDN:恰可感知差值(越小,人眼越敏感)
编码预备
-
冗余的种类:时间、空间、心里视觉、编码冗余
-
编码过程:f(x,y) -> 信源编码(抽样、量化、编码)-> 信道编码 -> ...
-
信息量:log2(1/P)
-
熵:平均信息量 = H(x) = ∑ Pj (-log2(Pj))
-
平均码长:Lavg
编码技术
-
哈夫曼编码
-
算术编码
-
游程编码
-
跳白块编码:WBS = white block skipping
-
方块编码:BTC = block truncation coding
JPEG编码技术
-
DPCM:差分脉冲调制
-
DU:data unit (8x8)
-
DCT系数:范围0~2040,需要除以量化系数
-
DC系数(预测编码)、AC系数(游程编码)
视频编码
-
运动估计:运动矢量MV(DPCM编码)
-
运动补偿:残差(DCT+游程编码)
-
匹配准则:SAD(sum of difference)
-
快匹配方法(固定搜索模式)
全搜索法:FSA
三步搜索法:Three Step Search
四部搜索法、菱形搜索法
-
HEVC编码结构:All-intra、Low-delay、Random-access
-
码率控制技术
-
率失真BR