《H.265/HEVC——视频编码新标准及其扩展》一:视频编码基础


  声明:在专业课学习上都已经接触过的内容,在本博客中不再赘述。

1.2.1 图像的自相关系数

  图像的相关函数:可以直接反映任意图像像素之间的关联程度,可以在统计平均的意义上来计算他们之间的相似程度。
在这里插入图片描述

个人觉得(1.13)的公式出错了,公式分子上的两个求和符号应该是没有的,并且应该 × N 2 \times N^2 ×N2【有读者给我评论一起探讨吗?】

在这里插入图片描述

1.2.2 像素差值的自相关函数

  • 空域像素的差值分布
    在这里插入图片描述
  • 时域像素的差值分布
    在这里插入图片描述

1.3 混合编码

  基于统计的视频压缩常见方法:

  • 建立在图像差值信号分布集中基础上便于压缩处理的预测编码【帧内编码、帧间编码、多视点视频中的视点间预测编码等】
  • 建立在正交变换可以将分散分布的图像数据,在变换域集中分布的基础上便于压缩处理的变换编码【离散余弦变换、离散正弦变换等】
  • 将上述两种方法结合起来使用:混合编码

1.3.3 运动估计和运动补偿

在这里插入图片描述

  1. 运动矢量(Motion Vector,MV)
  2. 运动估计(Motion Estimation,ME)
  3. 运动补偿(Motion Compensation,MC)
  4. 块匹配方法(Block Matching Arithmetic,BMA)
      块匹配运动估计原理
    在这里插入图片描述
      块匹配运动估计算法
  5. 全搜索算法:对搜索区域内每一个可能的位置上都进行误差计算和比较,找到使MSE或SAD最小时的点(i,j)值,作为所需的运动矢量。这种方法称为全搜索(Full Search,FS)算法,优点使比较准确,能够获得全局最优解,缺点是匹配运动量大,如果采用MAD准则,需计算 ( 2 d + 1 ) 2 (2d+1)^2 (2d+1)2次SAD值。
  6. 快速算法:有好多快速算法,下面介绍三步搜索(TSS)算法。在这里插入图片描述

1.5 率失真优化

  视频编码的性能基本取决于编码码率、压缩失真和计算复杂度等因素。
  码率和失真的关系在理论上是由率失真定理奠定的,但要将此定理应用到实践中,还需要考虑更多的限制条件、一定的简化措施和假设条件。

1.5.1 图像的信源熵

  1. 无记忆信源熵
    在这里插入图片描述
  2. 有记忆信源熵
    在这里插入图片描述

1.5.2 率失真定理

  1. 编码模型
      如果信息在发、收过程中,没有任何信息丢失,发送集与接收集的符号是一一对应的,这时编码所采用的最佳方法就是所谓的熵编码,码率的下界由信源0阶熵 H ( X ) = − ∑ i p ( α i ) l o g 2 P ( α i ) H(X)=-\sum_ip(\alpha_i)log_2P(\alpha_i) H(X)=ip(αi)log2P(αi)确定。
  2. 互信息量(信息论的课上讲过的)
  3. 失真度量
    在这里插入图片描述
  4. 率失真函数
      平均互信息量 I ( X ; Y ) I(X;Y) I(X;Y)实际上是编解码系统的编码输出的信息量,对于一个好的编码器,要求满足一定失真条件下其平均互信息量越小越好。因为编码器的平均互信息量越小,即输出的码字越少。
    在这里插入图片描述

1.5.3 失真率函数

  在失真率函数的指导下,视频编码的问题可归结为:在保证比特率R不超过最大比特率 R m a x R_{max} Rmax的条件下,通过选择优化的编码方案和编码参数,使失真D达到最小,能够获得“最好”的重建图像质量(PSNR最高)
在这里插入图片描述

1.5.5 率失真优化编码

  率失真定理就是在给定比特率的情况下寻找编码失真最小的编码器,其方法称为率失真优化(Rate Distortion Optimization,RDO)。

  1. 率失真优化方法
    在这里插入图片描述

拉格朗日乘子法:
在这里插入图片描述
在这里插入图片描述

  1. 率失真优化的量化
    在这里插入图片描述
  2. 率失真优化的模式判决
    在这里插入图片描述
  3. 率失真优化的运动估计
      在块运动估计方法中,理论上看,最优运动矢量的选择不一定使SAD值最小所对应的那个运动矢量,而是应该看它对所形成的编码图像的最终比特数的影响来决定。
      实验表明,用于实现块运动矢量估计的拉格朗日乘子可由下式计算:
    在这里插入图片描述

1.6 图像质量评价

  包括两个方面:图像的逼真度+图像的可懂度(指图像能向人或及其提供信息的能力)
  一般来说,图像可懂度属于更高层次的问题,涉及更多人的感知判断。

1.6.2 客观质量评价方法

  1. 均方误差MSE
  2. 峰值信噪比PSNR
    在这里插入图片描述
    在这里插入图片描述

感觉这里公式是不是错了,如果 C 3 = C 2 / 2 C_3=C_2/2 C3=C2/2的话,圈出来的数字应该是4

  SSIM(x,y)指数是归一化的, 0 ≤ 0\leq 0SSIM(x,y)$\leq$1,且SSIM(x,y)的值越接近1,说明失真图像的主观质量越好。
  

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
H.265/HEVC(High Efficiency Video Coding)是视频编码标准,也是H.264/AVC(Advanced Video Coding)的后继者。H.265/HEVC的目标是提供比H.264/AVC更高的压缩性能,即可以在相同的视频质量下减小文件大小,或者在相同的文件大小下保持更高的视频质量。 H.265/HEVC通过引入一系列的技术和算法来实现高效率的视频编码。其中一项重要的改进是采用更高级的块划分和运动估计算法,以利用视频序列中的时空相关性。此外,H.265/HEVC还引入了的预测模式、变换和量化方法,以更好地利用视频序列中的统计特性。通过这些改进,H.265/HEVC可以达到更高的编码效率,减小文件大小。 H.265/HEVC还支持更高的分辨率和更高的帧率。相比于H.264/AVC,H.265/HEVC可以编码更大尺寸的视频,以适应高清视频和超高清视频的需求。此外,H.265/HEVC还支持更高的帧率,可以编码更流畅的视频。 H.265/HEVC还有一些其他的扩展特性。例如,它可以支持更多的色彩空间和位深度,以提供更丰富和准确的颜色表现。它还支持有损和无损视频编码,以满足不同应用场景的需求。 总的来说,H.265/HEVC是一种具有高压缩性能和更好视频质量的视频编码标准。它在视频通信、视频点播和储存等领域有着广泛的应用前景,可以为用户提供更好的观看体验,并帮助节省带宽和存储空间。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值