X264编码器参数

  摘要:x264是开源的AVC/H264编码器的实现版本,了解其参数能够更加充分的理解对应视频编码在工业应用。本文根据网络上的资料收集和整理了大部分H264编码器的参数和其作用。
  关键字:x264

1. x264简介

  H.264是ITU(International Telecommunication Unite 国际通信联盟)和MPEG(Motion Picture Experts Group 运动图像专家组)联合制定的视频编码标准。从1999年开始,到2003年形成草案,最后在2007年定稿有待核实。在ITU的标准里称为H.264,在MPEG的标准里是MPEG-4的一个组成部分–MPEG-4 Part 10,又叫Advanced Video Codec,因此常常称为MPEG-4 AVC或直接叫AVC。
  H.264编码能实现非常好的压缩比,有广泛的适用码率(适于从超低码率低延迟的电话会议到高码率的BluRay光盘和HDTV码流),良好的硬件支持(以PSP、iPod和显卡DXVA为代表)和众多强大的厂商作后盾。
  x264始于2003年,从当开源社区的MPEG4-ASP编码器Xvid小有所成时开始的,经过几年的开发,特别是Dark Shikari加入开发后,x264逐渐成为了最好的视频编码器。

  源代码参考X264源代码

2 X264参数

  通常安装的x264是一个可执行文件,该可执行文件可以通过命令参数来执行具体的编码。下面简单描述每个参数的具体作用。

2.1 预设参数

  • –profile:设置H264视频的配置,设置成功会覆盖所有的参数设置。可选参数有:
    • baseline:无损,非隔行扫描,–no-8x8dct --bframes 0 --no-cabac --cqm flat --weightp 0;
    • main:–no-8x8dct --cqm flat,无损;
    • high:无损;
    • high10:支持8-10bit,无损;
    • high422:支持8-10bit,YUV420和YUV422;
    • high444:支持8-10bit,YUV420、YUV422和YUV444。
  • –present:压缩效率和运算时间中平衡的预设值。如果指定了一个预设值,它会在其它选项生效前生效。可选的值有:ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow和placebo。
  • –tune:上一个选项基础上进一步优化输入。如果定义了一个tune值,它将在preset之后,其它选项之前生效。可选:film、animation、grain、stillimage、psnr、ssim、fastdecode、zerolatency和touhou。
  • –slow-firstpass:使用–pass 1会在解析命令行时增加一些设置。如果设置preset=placebo则自动关闭此特性。如果想显式关闭此特性,使用slow-firstpass。

2.2 帧类型选项

  • -I, --keyint:设置GOPSize,默认值为250;

IDR帧是视频流的“分隔符”,所有帧都不可以使用越过关键帧的帧作为参考帧。IDR帧是I帧的一种,所以它们也不参照其它帧。这意味着它们可以作为视频的搜索(seek)点。通过这个设置可以设置IDR帧的最大间隔帧数(亦称最大图像组长度)。较大的值将导致IDR帧减少(会用占用空间更少的P帧和B帧取代),也就同时减弱了参照帧选择的限制。较小的值导致减少搜索一个随机帧所需的平均时间。

  • -i, --min-keyint:最小的GPOSize,默认为auto
    • no-scenecut:完全关闭自适应I帧决策;
    • scenecut:设置决策使用I帧、IDR帧的阈值(场景变换检测);

    x264会计算每一帧与前一帧的不同程度并得出一个值。如果这个值低于scenecut,那么就算检测到一个“场景变换”。如果此时距离上一帧的距离小于 min-keyint则插入一个I帧,反之则插入一个IDR帧。较高的值会增加侦测到“场景变换”概率。

    • intra-refresh:让x264为每keyint数量的帧使用宏块内部编码取代IDR帧;

    块以水平移动列的方式更新,也叫刷新波。对于低延迟的流,这样可以让帧的尺寸比使用标准的IDR帧更加保持恒定。而且这样可以增强视频流对丢包的容错能力。这个选项会降低压缩率,所以在确实需要的时候才选择它。

  • -b, --bframes:设置x264可使用的B帧的最大连续数量,默认3;
    • –b-adapt:设置B帧决策算法,这个选项会影响到x264使用P帧或者B帧;

      • 0:关闭。总是使用B帧。和以前的 no-b-adapt选项效果相同;
      • 1:‘快速’算法。快速,–b-frames越大速度越快;
      • 2:‘最佳’算法,慢速,–b-frames越大速度越慢;
    • –b-bias:调节使用B帧的力度。越大的值越偏向B帧,可以在-100和100之间选择。100或-100不能保证完全或是全是B帧(使用 –b-adapt 0);

    • –b-pyramid:允许B帧作为参照帧。如果关闭,那么只有I帧和P帧才能作为参照帧。可以作为参照帧的B帧的量化参数会介于P帧和普通B帧之间。只在–b-frames设置大于等于2时此选项才生效。如果是在为蓝光光盘编码,请使用none或者strict。

      • none:不允许B帧作为参照帧;
      • strict:一个图像组内只允许一个B帧参照帧,这是蓝光编码强制要求的标准;
      • normal:任意使用B帧参照帧;
    • –open-gop:Open-GOP是一个提升压缩效率的编码技术,有些解码器不能完全支持open-GOP流,因此这个选项默认关闭;

      • none:关闭
      • normal:开启
      • bluray:开启。一个稍低效的open-GOP版本,因为normal模式不能用于蓝光编码。

      open and closed gops all you need to know

    • –no-cabac:关闭CABAC (Context Adaptive Binary Arithmetic Coder)压缩,使用较为低效的CAVLC (Context Adaptive Variable Length Coder)。这两者在压缩效率和解码效率上有10%-20%的差别;

  • -r --ref:控制DPB (Decoded Picture Buffer)的大小。可以在0-16之间选择。简单地说,就是设置P帧可以选择它之前的多少帧作为参照帧(B帧的值要小1-2,取决于那个B帧能不能作为参照)。最小可以选择值1,只参照自己前面的那帧。注意H.264标准限制了每个level可以参照的帧的数量。如果选择level4.1,1080p最大选4,720p最大选9;
    • no-deblock:完全关闭内置去块滤波器;
  • -f --deblock:调节H.264标准中的内置去块滤波器。这是个性价比很高的选择;
    • –slices:设置每帧的分片数,强制使用矩形分片;
    • –slice-max-size:设置每个分块包括NAL头的最大大小(bytes);
    • –slice-max-mbs:设置每个分块包含的最大宏块数量;
    • –slice-min-mbs:设置每个分块包含的最小宏块数量;
    • –tff:开启隔行编码并设置上半场在前。x264的隔行编码使用MBAFF,因此效率不如逐行扫描。所以,仅在需要在隔行显示的设备上显示时才开启这个选项;
    • –bff:开启隔行编码并设置下半场在前;
    • –constrained-intra:开启SVC编码的底层要求的强制帧内预测;
    • –pulldown:为你的输入流(逐行扫描的,固定帧率的)使用一组预设的“soft pulldown”;可选的参数有:none、22、32、64、double、triple、euro;
    • –fake-interlaced:把流标志为隔行的但不按隔行编码。用于编码25p和30p的蓝光兼容视频;
    • –frame-packing:对于立体视频,定义帧排列方式:
      • 0:棋盘格 - 像素交替来自左眼和右眼
      • 1:列交替 - 左眼和右眼通过列交替交织
      • 2:行交替 - 左眼和右眼通过行交替交织
      • 3:左右并排 - 左眼在左侧,右眼在右侧
      • 4:上下并排 - 左眼在上方,右眼在下方
      • 5:帧交替 - 每帧显示一个视图
      • 6:单眼 - 2D帧,没有任何帧包装
      • 7:平铺格式 - 左眼在左上方,右眼分割在其余区域

2.3 码率控制

  • -q, --qp:强制使用恒定的QP值(0-81,0=无损);
  • -B, --bitrate:设置比特率(kbit/s);
    • –crf:基于质量的可变比特率(-12-51)[23.0];
    • –rc-lookahead:预测帧类型的帧数 [40];
    • –vbv-maxrate:最大本地比特率(kbit/s)[0];
    • –vbv-bufsize:设置VBV缓冲区大小(kbit)[0];
    • –vbv-init:初始VBV缓冲区占用率 [0.9];
    • –crf-max:使用CRF+VBV时,限制RF到此值可能导致VBV下溢!;
    • –qpmin:设置最小QP值 [0];
    • –qpmax:设置最大QP值 [81];
    • –qpstep:设置最大QP步长 [4];
    • –ratetol:ABR速率控制和VBV的容差 [1.0];
    • –ipratio:I和P之间的QP因子 [1.40];
    • –pbratio:P和B之间的QP因子 [1.30];
    • –chroma-qp-offset:色度与亮度之间的QP差异 [0];
    • –aq-mode:AQ方法 [1];
      • 0: 禁用;
      • 1: 方差AQ(复杂度掩码);
      • 2: 自动方差AQ;
      • 3: 自动方差AQ,并偏向于暗场景;
    • –aq-strength:减少平坦和纹理区域中的块和模糊 [1.0];
  • -p, --pass:启用多通道速率控制;
    • 1: 第一遍,创建统计文件;
    • 2: 最后一遍,不覆盖统计文件;
    • 3: 第N遍,覆盖统计文件;
    • –stats:用于两遍统计的文件名 [“x264_2pass.log”];
    • –no-mbtree:禁用mb-tree速率控制;
    • –qcomp:QP曲线压缩 [0.60];
    • –cplxblur:减少QP的波动(曲线压缩之前) [20.0];
    • –qblur:减少QP的波动(曲线压缩之后) [0.5];
    • –zones:调整视频区域的比特率;每个区域的格式为<起始帧数>,<结束帧数>,<选项>,其中<选项>可以是q=<整数>(强制QP)或 b=<浮点数>(比特率倍增器);
    • –qpfile:强制一些或所有帧的帧类型和QP值;每行的格式:帧号 帧类型 QPQP是可选的(none表示由x264选择)。帧类型:I,i,K,P,B,b。K=<I或i>取决于open-gop设置QP受qpmin/qpmax的限制。

2.4 分析

  • -A,–partitions:要考虑的分区。可选值为[“p8x8, b8x8, i8x8, i4x4”],表示考虑的分区类型,包括p8x8、p4x4、b8x8、i8x8、i4x4、none和all。
    • –direct:直接运动矢量(MV)预测模式。可选值为[“spatial”],表示直接MV预测模式,包括none、spatial、temporal和auto。
    • –no-weightb:禁用B帧的加权预测。
    • –weightp:P帧的加权预测。可选值为[2],表示加权预测的类型,包括0(禁用)、1(加权参考帧)和2(加权参考帧+复制帧)。
    • –me:整数像素运动估计方法。可选值为[“hex”],表示整数像素运动估计方法,包括dia(钻石搜索,半径1,快速)、hex(六边形搜索,半径2)、umh(不均匀多六边形搜索)、esa(穷举搜索)和tesa(哈达玛穷举搜索,慢)。
    • –merange:最大运动矢量搜索范围,默认值为16。
    • –mvrange:最大运动矢量长度,默认值为-1(自动)。
    • –mvrange-thread:线程之间的最小缓冲区,默认值为-1(自动)。
  • -m, --subme:亚像素运动估计和模式决策。可选值为[7],表示亚像素运动估计和模式决策的级别,包括0(仅全像素,不推荐使用)、1(SAD模式决策,一次qpel迭代)、2(SATD模式决策)等。
    • –psy-rd:心理视觉优化的强度,默认值为"1.0:0.0"。其中,#1表示RD(需要subme>=6),#2表示Trellis(需要trellis,实验性)。
    • –no-psy:禁用所有恶化PSNR和SSIM的视觉优化。
    • –no-mixed-refs:不基于每个分区来决定引用帧。
    • –no-chroma-me:忽略运动估计中的色度。
    • –no-8x8dct:禁用自适应空间变换大小。
  • -t, --trellis:Trellis RD量化,默认值为1。可选值为0(禁用)、1(仅在MB的最终编码中启用)、2(在所有模式决策中启用)。
    • –no-fast-pskip:在P帧上禁用早期SKIP检测。
    • –no-dct-decimate:在P帧上禁用系数阈值。
    • –nr:降噪,默认值为0。
    • –deadzone-inter:设置互帧亮度量化deadzone的大小,默认值为21。
    • –deadzone-intra:设置帧内亮度量化deadzone的大小,默认值为11。deadzone的大小应在0到32之间。
    • –cqm:预设量化矩阵。可选值为[“flat”],表示预设的量化矩阵类型,包括flat和jvt。
    • –cqmfile:从与JM兼容的文件中读取自定义的量化矩阵。会覆盖其他–cqm*选项。
    • –cqm4:设置所有的4x4量化矩阵。需要提供一个由16个整数组成的逗号分隔列表。
    • –cqm8:设置所有的8x8量化矩阵。需要提供一个由64个整数组成的逗号分隔列表。
    • –cqm4i, --cqm4p, --cqm8i, --cqm8p:同时设置亮度和色度的量化矩阵。
    • –cqm4iy, --cqm4ic, --cqm4py, --cqm4pc:设置单独的亮度和色度量化矩阵。

2.5 设置视频可用性信息

  VUI设置不被编码器使用,只是对播放设备的建议。

  • –overscan:指定裁剪超扫描设置。可选值为[“undef”],表示裁剪超扫描的设置,包括undef、show和crop。
  • –videoformat:指定视频格式。可选值为[“undef”],表示视频格式,包括component、pal、ntsc、secam、mac和undef。
  • –range:指定颜色范围。可选值为[“auto”],表示颜色范围,包括auto、tv和pc。
  • –colorprim:指定颜色原色。可选值为[“undef”],表示颜色原色,包括undef、bt709、bt470m、bt470bg、smpte170m、smpte240m、film、bt2020、smpte428、smpte431和smpte432。
  • –transfer:指定传输特性。可选值为[“undef”],表示传输特性,包括undef、bt709、bt470m、bt470bg、smpte170m、smpte240m、linear、log100、log316、iec61966-2-4、bt1361e、iec61966-2-1、bt2020-10、bt2020-12、smpte2084、smpte428和arib-std-b67。
  • –colormatrix:指定颜色矩阵设置。可选值为[“???”],表示颜色矩阵设置,包括undef、bt709、fcc、bt470bg、smpte170m、smpte240m、GBR、YCgCo、bt2020nc、bt2020c、smpte2085、chroma-derived-nc、chroma-derived-c和ICtCp。
  • –chromaloc:指定色度采样位置(0到5)。默认值为0。
  • **–mastering-display :指定主显示器的亮度、白点和显示亮度。格式为’G(x,y)B(x,y)R(x,y)WP(x,y)L(max,min)'。
  • –cll:指定内容光亮度的最大值和最大帧平均值。格式为’max_content,max_frame_average’。
  • –alternative-transfer:指定备用传输特性。可选值与–transfer相同。
  • –nal-hrd:信号HRD信息(需要vbv-bufsize)。可选值为none、vbr、cbr(.mp4中不允许使用cbr)。
  • –filler:强制使用硬CBR并生成填充数据(隐含–nal-hrd cbr)。
  • –pic-struct:强制在图像定时SEI中使用pic_struct。
  • –crop-rect:将’left,top,right,bottom’添加到比特流级别的裁剪矩形。
  • 30
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
x264是一款开源的视频编码器,它采用H.264/AVC视频编码标准,被广泛应用于视频压缩、视频传输等领域。下面是对x264视频编码器源码的简要解析。 x264的整体架构分为以下几个模块: 1. 预处理模块 预处理模块主要负责对输入的视频进行预处理,包括色彩空间转换、图像缩放、去噪等处理。在预处理模块中,会首先对输入的YUV格式的视频进行格式转换,转换成x264支持的色彩空间格式,然后再进行其他处理。 2. 分块模块 分块模块将图像划分成多个块,每个块的大小可以由用户指定,在x264中,块大小一般为16x16或者8x8。分块模块将每个块的像素值按照一定的顺序排列,并存储在一个数组中,以便后续操作。 3. 预测模块 预测模块主要负责对图像进行运动估计和帧内预测。运动估计是指在当前帧中,通过比对前一帧或者参考帧中相似块的像素值,预测当前块的像素值。帧内预测是指在当前帧中,通过相邻块的像素值,预测当前块的像素值。 4. 变换模块 变换模块主要负责对预测残差进行离散余弦变换(DCT),将空域中的像素变换到频域中,以便后续的量化操作。在x264中,采用了4x4和8x8两种不同大小的DCT变换。 5. 量化模块 量化模块将DCT系数按照一定的规则进行量化,即将大的DCT系数变小,以减小编码后的比特率。在x264中,采用了不同的量化矩阵,以适应不同的场景需求。 6. 熵编码模块 熵编码模块将量化后的DCT系数进行编码,生成比特流。在x264中,采用了自适应的上下文建模技术,以提高编码效率。 7. 决策模块 决策模块主要负责对编码参数进行优化,以达到最佳的编码效果。在x264中,采用了基于码率失真优化的算法,通过不断调整编码参数,使得编码后的视频质量最好,同时保证视频的比特率不超过预设的值。 总之,x264视频编码器源码的设计非常精妙,涵盖了众多的技术领域,从预处理到量化编码,每个模块都充分考虑到了实际应用场景的需求,使得x264成为了一款高效、稳定、灵活的视频编码器

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值