视频编解码的缩略语

本文介绍了HEVC视频编码标准中的重要技术概念,如DCT变换、RDO率失真优化、ROI感兴趣区域编码、PSNR和SSIM图像质量指标,以及编码单元CU、预测单元PU、变换单元TU等,深入理解这些概念对于视频压缩和图像处理至关重要。
摘要由CSDN通过智能技术生成

hevc缩略语链接

DCT

DCT全称为Discrete Cosine Transform,即离散余弦变换。DCT变换属于傅里叶变换的一种,常用于对信号和图像(包括图片和视频)进行有损数据压缩。

RDO

RDO (Rate Distortion Optimization),率失真优化。
视频编码中永恒的命题:视频码率和视频质量之间的权衡。
总体来说,RDO 的判决依据是率失真代价,精准地做出码率代价和失真代价的加权和,找到最优解。

RFC

Reference frame compression 参考帧压缩。

ROI

ROI(Region of Interest),感兴趣区域。
基于主观质量衡量标准,在视频编码过程中,我们可以对感兴趣区域进行低压缩比,甚至是无损压缩编码,以获得高质量的重建图像,而对非关注区域采用较高压缩率,这就是ROI视频编码技术。

微帧ROI (region of interest) encoding是一项基于感兴趣区域的视频编码技术,即对图像中感兴趣的区域降低量化参数值,从而分配更多码率以提升画面质量,而对不感兴趣的区域则提高量化参数值,从而分配更少码率,在不损失图像整体质量的前提下,降低视频码率。

ROI视频编码码率分配的基本思路是:在视频编码前,对输入的视频场景进行视觉感知分析以确定感兴趣区域。在编码过程中,通过调整编码参数,为感兴趣区域分配更多码率,使其拥有更好的视觉质量,而其他区域则相应减少分配的码率,因其误差敏感度较低而对整体视频质量影响较小。

ipcm

H.264中的I_PCM模式
I_PCM是一种帧内编码模式,在该模式下,编码器直接传输图像的像素值,而不经过预测和变换。在一些特殊的情况下,特别是图像内容不规则或者量化参数非常低时,这个模式相对于通常的帧内预测、变换、量化和熵编码过程更有效。

I_PCM模式用于以下目的:

1.允许编码器精确地表示像素值
2.提供表示不规则图像内容的准确性,而不引起重大的数据量增加
3.严格限制宏块解码比特数,但不降低编码效率

PSNR

PSNR全称为“Peak Signal-to-Noise Ratio”,中文意思即为峰值信噪比,是衡量图像质量的指标之一。PSNR是基于MSE(均方误差)定义,对给定一个大小为m*n的原始图像I和对其添加噪声后的噪声图像K,其MSE可定义为:
在这里插入图片描述
则PSNR可定义为:
在这里插入图片描述
其中在这里插入图片描述为图像的最大像素值,PSNR的单位为dB。若每个像素由8位二进制表示,则其值为2^8-1=255。但注意这是针对灰度图像的计算方法,若是彩色图像,通常可以由以下方法进行计算:

方法一:计算RGB图像三个通道每个通道的MSE值再求平均值,进而求PSNR
方法二:直接使用matlab的内置函数psnr()(注意该函数将所有图像当成灰度图像处理)。
方法三:将图像转为YCbCr格式,只计算Y分量即亮度分量的PSNR。
其中,第二和第三种方法比较常见。

PSNR评价标准

PSNR值越大,表示图像的质量越好,一般来说:

(1)高于40dB:说明图像质量极好(即非常接近原始图像)
(2)30—40dB:通常表示图像质量是好的(即失真可以察觉但可以接受)
(3)20—30dB:说明图像质量差
(4)低于20dB:图像质量不可接受

ssim

SSIM(Structural Similarity),结构相似性,是一种衡量两幅图像相似度的指标。SSIM使用的两张图像中,一张为未经压缩的无失真图像,另一张为失真后的图像。

给定两个图像x和y, 两张图像的结构相似性可按照以下方式求出

在这里插入图片描述
结构相似性的范围为0到1。当两张图像一模一样时,SSIM的值等于1

RPS

参考帧集

CTU

图像被分割成编码树单元(CTU), 每个CTU包含亮度CTB和色度CTB;
每个高度CTB表示图像中的LxL亮度像素块区域,对应的两个色度CTB的大小为L/2 x L/2;
L的大小可以是16,32,64,并在SPS的语法元素中声明;
相对于传统的16x16大小的宏块,HEVC对可变尺寸的CTB选择需要依据编码端的内存和计算资源来确定;
大尺寸的CTB支持,相对于之前的标准,在编码高分辨率视频内容时非常有效果;
CTU由一个亮度CTB,两个色度CTB以及相关语法组成;
CTU是解码处理的基本处理单元;

亮度CTB和色度CTB可以直接当作CB使用;
也可以更一步划分成多个CB;
划分是以树结构的方式实现;
HEVC的树划分方式通常是同时用于亮度和色度;

CTU包含一个四叉树的语法,它允许对CTB区域依据信号特征划分成合适尺寸的CB;
四叉树的切分处理可以迭代进行,直到亮度CB到了允许的最小尺寸,通常是8x8或更大;
这个语法元素在SPS中定义;

CU

CU编码单元是进行预测、变换、量化和熵编码等处理的基本单元;

PU

PU预测单元是进行帧内intra、帧间inter预测的基本单元;

TU

TU变换单元是进行变换、量化的基本单元。

ME

Motion Estimation 运动预测

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值