数据压缩(十五)——H.264编码

一、H.264编码实验

1.1 H.264文件解码得到YUV文件

1. 将MP4格式文件转成264文件
  MP4to264
2. 将264文件进行解码得到YUV文件
  修改decoder.cfg文件中的输入文件和输出文件。

InputFile             = "mov.264"       # H.264/AVC coded bitstream
OutputFile            = "mov.yuv"   # Output file, YUV/RGB

3. 实验结果
  MP4和yuv截取的帧并不是同一帧。命令行代码为ldecod.exe -d decoder.cfg

mov.mp4mov.yuvtrailer.mp4trailer.yuv
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

1.1 YUV文件编码得到H.264文件(GOP=15,2B)

  以上文中生成的mov.yuv作为实验材料。命令行代码为lencod.exe -d encoder.cfg
  修改配置文件修改encoder.cfg。

...
##########################################################################################
# Files
##########################################################################################
InputFile             = "mov.yuv"       # Input sequence
InputHeaderLength     = 0      # If the inputfile has a header, state it's length in byte here
StartFrame            = 0      # Start frame for encoding. (0-N)
FramesToBeEncoded     = 30      # Number of frames to be coded
...
SourceWidth           = 320    # Source frame width
SourceHeight          = 176    # Source frame height
SourceResize          = 0      # Resize source size for output
OutputWidth           = 320    # Output frame width
OutputHeight          = 176    # Output frame height
...
ReconFile             = "mov_test1_rec.yuv"       # Reconstruction YUV file
OutputFile            = "mov_test1.264"           # Bitstream
##########################################################################################
# Encoder Control
##########################################################################################
...
IntraPeriod           = 15   # Period of I-pictures   (0=only first)
...
##########################################################################################
# B Slices
##########################################################################################
NumberBFrames          = 2  # Number of B coded frames inserted (0=not 
disable, N <= NumberReferenceFrames)
...
HierarchicalCoding      =  0  # B hierarchical coding (0= off, 1= 2 layers, 2= 2 full hierarchy, 3 = explicit)
...

实验结果:
在这里插入图片描述

1.2 YUV文件编码得到H.264文件(GOP=1,全I帧)

  修改配置文件修改encoder.cfg。

...
##########################################################################################
# Files
##########################################################################################
InputFile             = "mov.yuv"       # Input sequence
InputHeaderLength     = 0      # If the inputfile has a header, state it's length in byte here
StartFrame            = 0      # Start frame for encoding. (0-N)
FramesToBeEncoded     = 30      # Number of frames to be coded
...
SourceWidth           = 320    # Source frame width
SourceHeight          = 176    # Source frame height
SourceResize          = 0      # Resize source size for output
OutputWidth           = 320    # Output frame width
OutputHeight          = 176    # Output frame height
...
ReconFile             = "mov_test2_rec.yuv"       # Reconstruction YUV file
OutputFile            = "mov_test2.264"           # Bitstream
##########################################################################################
# Encoder Control
##########################################################################################
...
IntraPeriod           = 1   # Period of I-pictures   (0=only first)
...
##########################################################################################
# B Slices
##########################################################################################
NumberBFrames          = 0  # Number of B coded frames inserted (0=not 
disable, N <= NumberReferenceFrames)
...
HierarchicalCoding      =  0  # B hierarchical coding (0= off, 1= 2 layers, 2= 2 full hierarchy, 3 = explicit)
...

实验结果:
在这里插入图片描述

1.3 YUV文件编码得到H.264文件(GOP=15,2B帧,码率修改)

  除了上面修改过的地方,还得在配置文件中新修改两处encoder.cfg。

...
##########################################################################################
# Files
##########################################################################################
InputFile             = "mov.yuv"       # Input sequence
InputHeaderLength     = 0      # If the inputfile has a header, state it's length in byte here
StartFrame            = 0      # Start frame for encoding. (0-N)
FramesToBeEncoded     = 30      # Number of frames to be coded
...
SourceWidth           = 320    # Source frame width
SourceHeight          = 176    # Source frame height
SourceResize          = 0      # Resize source size for output
OutputWidth           = 320    # Output frame width
OutputHeight          = 176    # Output frame height
...
ReconFile             = "mov_test3_rec.yuv"       # Reconstruction YUV file
OutputFile            = "mov_test3.264"           # Bitstream
##########################################################################################
# Encoder Control
##########################################################################################
...
IntraPeriod           = 15   # Period of I-pictures   (0=only first)
...
##########################################################################################
# B Slices
##########################################################################################
NumberBFrames          = 2  # Number of B coded frames inserted (0=not 
disable, N <= NumberReferenceFrames)
...
########################################################################################
#Rate control
########################################################################################

RateControlEnable       = 1     # 0 Disable, 1 Enable
Bitrate                 = 1000000 # Bitrate(bps)
...

实验结果:
在这里插入图片描述

1.4 用码流分析软件检查所生成的码流中各种编码模式和运动矢量等信息

1.4.1【GOP=15,2B】

  以上文中的mov_test1.264为例。

1.4.1.1 第一帧的编码模式和运动矢量

在这里插入图片描述
在这里插入图片描述

  选取的是第一帧,按照分析来看,第一帧一定是帧内编码帧(I帧),在分析软件中分析时也确实如此。其Slice Type为I Slice。
  同时,从图中,我们也可以看到,宏块的类型MB Type为I_16X16_2_1_1和I_4X4。两个宏块都是I类型的宏块。
  同时,由于是I帧的原因,运动矢量并不存在。从上图中发现也确实如此。

1.4.1.2 第四帧的编码模式和运动矢量

在这里插入图片描述
  由分析软件可知,Slice Type为P Slice,即该帧为前向预测帧(P帧),所以运动矢量应该是只有前向预测所得的运动矢量,从图中可以看出也确实如此,只有前向预测的绿色运动矢量。

1.4.1.3 第四帧的编码模式和运动矢量

在这里插入图片描述
  由分析软件可知,Slice_Type为B Slice,即该帧为双向预测帧(B帧),所以运动矢量应该有两种,一种是前向预测所得,一种是后向预测所得,从图中可以看出也确实如此,拥有红色和绿色两种不同的运动矢量。

1.4.2 【GOP=1,全I帧】

  以上文中的mov_test3.264为例。

1.4.2.1 第一帧的编码模式和运动矢量

在这里插入图片描述
  由于是I帧的原因,运动矢量并不存在。从上图中发现也确实如此。

1.4.2.2 第四帧的编码模式和运动矢量

在这里插入图片描述
  和上一小节中【GOP=15,2B】的码流不同,该码流的第4帧也是I帧编码,这和编码时所选取的参数是一致的,编码时让该码流为全I帧编码。
  同时,由于是I帧的原因,运动矢量并不存在。

1.4.3 总结

  全I帧编码和【GOP=15,2B】比较,B帧属于极端的没有。
  由分析可知,B帧越多的话,相对来说,运动矢量会越多。
  同时,由所学知识和在播放器中码流的表现来看,在前后两帧画面相差大的情况下,运动矢量也会相应增多。

1.5 用播放器观看所生成码流的质量【改变GOP组长度和B帧】

  所用的yuv文件是上文中生成的mov.yuv。我们所使用的编码方式分别为如下几种:

  1. GOP=15,2B帧,1000kb/s
  2. GOP=12,2B帧,1000kb/s
  3. GOP=9,2B帧,1000kb/s
  4. GOP=12,1B帧,1000kb/s
  5. GOP=12,无B帧,1000kb/s
  6. GOP=1,全I帧,1000kb/s
  7. GOP=15,2B帧,800kb/s
  8. GOP=15,2B帧,400kb/s
  9. GOP=12,2B帧,800kb/s
  10. GOP=12,2B帧,400kb/s
  11. GOP=9,2B帧,800kb/s
  12. GOP=9,2B帧,400kb/s
  13. GOP=12,1B帧,800kb/s
  14. GOP=12,1B帧,400kb/s
  15. GOP=12,无B帧,800kb/s
  16. GOP=12,无B帧,400kb/s
  17. GOP=1,全I帧,800kb/s
  18. GOP=1,全I帧,400kb/s

1.5.1 GOP=15,2B帧,1000kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为1028.23kbit/s,其Y-PSNR为40.763dB。

1.5.2 GOP=12,2B帧,1000kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为927.68kbit/s,其Y-PSNR为39.546dB。

1.5.3 GOP=9,2B帧,1000kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为676.02kbit/s,其Y-PSNR为38.171dB。

1.5.4 GOP=12,1B帧,1000kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为1066.14kbit/s,其Y-PSNR为43.280dB。

1.5.5 GOP=12,无B帧,1000kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为1004.25kbit/s,其Y-PSNR为43.126dB。

1.5.6 GOP=1,全I帧,1000kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为997.76kbit/s,其Y-PSNR为35.867dB。

1.5.7 GOP=15,2B帧,800kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为920.62kbit/s,其Y-PSNR为40.553dB。

1.5.8 GOP=15,2B帧,400kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为397.98kbit/s,其Y-PSNR为37.775dB。

1.5.9 GOP=12,2B帧,800kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为846.92kbit/s,其Y-PSNR为39.368dB。

1.5.10 GOP=12,2B帧,400kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为424.61kbit/s,其Y-PSNR为37.356dB。

1.5.11 GOP=9,2B帧,800kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为676.02kbit/s,其Y-PSNR为38.171dB。

1.5.12 GOP=9,2B帧,400kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为427.82kbit/s,其Y-PSNR为36.941dB。

1.5.13 GOP=12,1B帧,800kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为840.67kbit/s,其Y-PSNR为42.529dB。

1.5.14 GOP=12,1B帧,400kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为400.62kbit/s,其Y-PSNR为39.093dB。

1.5.15 GOP=12,无B帧,800kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为803.48kbit/s,其Y-PSNR为41.975dB。

1.5.16 GOP=12,无B帧,400kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为398.04kbit/s,其Y-PSNR为37.986dB。

1.5.17 GOP=1,全I帧,800kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为803.46kbit/s,其Y-PSNR为34.871dB。

1.5.18 GOP=1,全I帧,400kb/s

在这里插入图片描述
在这里插入图片描述
  该帧的实际码率为400.90kbit/s,其Y-PSNR为32.408dB。

1.5.19 码流不同时播放器质量

GOP=9,2B

1000kb/s800kb/s400kb/s
在这里插入图片描述在这里插入图片描述在这里插入图片描述

  可以发现,用播放器查看时的264视频质量无甚区别。

1.5.20 GOP组长度不同时播放器质量

2B,1000kb/s

15129
在这里插入图片描述在这里插入图片描述在这里插入图片描述

  可以发现,用播放器查看时的264视频质量无甚区别。

1.5.21 B帧长度不同时播放器质量

GOP=12,1000kb/s

2B1B无B
在这里插入图片描述在这里插入图片描述在这里插入图片描述

  可以发现,用播放器查看时的264视频质量无甚区别。

1.6 生成率失真曲线

  将前文中得到的实际码率和Y-PSNR整理到一个表格中,得到如下图所示的表格。
在这里插入图片描述
  根据上述表格中的数据作图,如下图所示:

在这里插入图片描述
  至此,实验结束,上图即为率失真曲线的图。

二、H.264编码原理

  H.264相比于之前讲过的MPEG-2来说,注重实用,采用更成熟的技术,要求更高的编码效率和简洁的表现形式。
  与此同时,在混合编码器的基本框架下,H.264对MPEG-2中的主要关键模块都进行了重大改进。
  但是,H.264标准的预测、变换、量化、熵编码等基本模块和MPEG-2并没有太大的区别,变化主要体现在功能模块的具体细节上。
H.264的主要特点:

  1. 压缩效率高
  2. 容错能力强
  3. 网络适应性好
  4. 计算复杂度高

在这里插入图片描述
在这里插入图片描述
H.264和其他MPEG-2编码标准的差异:

  1. 帧内预测
    在空间域内进行帧内预测,提高帧内编码的精确度。
  2. 运动估计和运动补偿
    不同尺寸的块和形状,高分辨率的子像素运动估计,选择多个参考帧
  3. DCT变换
    使用整数的DCT变换
  4. 去块效应滤波
    为消除块效应,增加了自适应消块滤波器
  5. 熵编码技术
    通用变长编码(UVLC),基于上下文的自适应变长码编码(CAVLC),基于上下文的自适应二进制算术编码(CABAC)
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值