cutree 算法

shakingWaves

已于 2023-09-19 11:16:58 修改

阅读量480

点赞数 1

分类专栏：视频编解码文章标签：算法

于 2023-09-19 11:13:08 首次发布

本文链接：https://blog.csdn.net/shakingWaves/article/details/133019401

版权

视频编解码专栏收录该内容

12 篇文章 10 订阅

订阅专栏

传播

由于块与块之间具有参考关系，提升被参考块的质量，可以改善后续参考块的质量

在这里插入图片描述

Pn+1帧中CU0,1完全参考Pn的CU1,1。且Pn+1帧中CU0,1块帧内预测和帧间预测的代价分别为 $c_{x,y}^{n+1}(0,0)$ 和 $c_{x,y}^{n+1}(d0,d1)$ ，其中x,y表示这里CU的坐标，也就是(x,y)=(0,1),为了一般性，所以用x,y表示。

如果 $c_{x,y}^{n+1}(0,0)$ 和 $c_{x,y}^{n+1}(d0,d1)$ 相差不大，说明Pn+1帧中CU0,1块从Pn的CU1,1获取的信息很少；如果 $c_{x,y}^{n+1}(0,1)$ 比 $c_{x,y}^{n+1}(d0,d1)$ 小很多说明Pn+1帧中CU0,1块的大部分信息都可以从Pn的CU1,1块获得，极端情况，如果 $c_{d0,d1}^{n+1}$ 为0，说明说明Pn+1帧中CU0,1块的全部信息都可以从Pn的CU1,1块获得。因此可以简单地用 $pc_{x,y}^{n+1}=c_{x,y}^{n+1}(0,0)-c_{x,y}^{n+1}(d0,d1)$ 表示Pn+1帧中CU0,1块从Pn的CU1,1继承的信息。

由于Pn+1帧中CUx,y块编码参数选择不同，会导致 $pc_{x,y}^{n+1}=c_{x,y}^{n+1}(0,0)-c_{x,y}^{n+1}(d0,d1)$ 的使用率不同，因此 $pf_{x,y}^{n+1}=\frac{c_{x,y}^{n+1}(0,0)-c_{x,y}^{n+1}(d0,d1)}{c_{x,y}^{n+1}(0,0)}$ 表示Pn+1帧中CU0,1块反向传播给Pn的CU1,1块的传播率，或者说是Pn+1帧对Pn帧中CU1,1块的继承信息的利用率，也就是Pn+1帧CUx,y选择不同参数时，对 $pc_{x,y}^{n+1}=c_{x,y}^{n+1}(0,0)-c_{x,y}^{n+1}(d0,d1)$ 的使用率。

Pn+1帧中CU0,1块的传播给Pn的CU1,1块的总信息 $pa_{x,y}^{n+1}=pc_{x,y}^{n+1}+pf_{x,y}^{n+1} \cdot pi_{x,y}^{n+1}$ 所有参考Pn帧CU1,1块的CU块，反向传播给它的信息量为 $pi_{x,y}^{n}=pa_{x1,y1}^{n1} \cdot w1 + pa_{x2,y2}^{n2} \cdot w2 + pa_{x3,y3}^{n3} \cdot w3 + ...$ ，其中w表示权重，也就是区域的重叠面积，针对上图中 $pi_{1,1}^{n}=pa_{1,0}^{n+1} \cdot 1 + pa_{1,1}^{n+1} \cdot 1$

在x265中使用estimateCUPropagate函数计算 $pa_{x,y}^{n}$ :

$\begin{align} pa_{x,y}^{n}&=pc_{x,y}^{n}+pf_{x,y}^{n} \cdot pi_{x,y}^{n} \\ &=(c_{x,y}^{n}(0,0) + pi_{x,y}^{n}) \cdot \frac{c_{x,y}^{n}(0,0)-c_{x,y}^{n}(d0,d1)}{c_{x,y}^{n}(0,0)} \\ &= (c_{x,y}^{n}(0,0) + pi_{x,y}^{n}) \cdot pf_{x,y}^{n} \end{align}$

上述考虑了只有cutree时，信息量的传播，还需要做两个细微的修正：AQ将各个MB都进行了微调，那么那些被调整的更清晰的MB（QP减小）和变得更模糊的MB（QP变大）也需要进行修正 $inv_qscale=\frac{1}{aq_offset_step}$
在可变帧率条件下，需要根据播放时长进行修正， $fps_factor=\frac{当前帧播放时长}{平均一帧播放时长}$
如下图，中间的B帧同时从前向的P0帧和后向的P1帧都继承了信息，需要按照距离修正传播的cost大小， $distance_ratio=\frac{b-p0}{p1-p0}$

经过以上三个修正，最终结果如下：
在这里插入图片描述

$\begin{align} pa_{x,y}^{n}&=(pc_{x,y}^{n}\cdot inv\_qscale\cdot fps\_factor+pf_{x,y}^{n} \cdot pi_{x,y}^{n})\cdot distance\_ratio \\ &= (c_{x,y}^{n}(0,0) \cdot inv\_qscale \cdot fps\_factor+ pi_{x,y}^{n}) \cdot pf_{x,y}^{n} \cdot distance_ratio \end{align}$

以上计算得到的 $pa_{x,y}^{n}$ 需要根据mv传递到第Pn-1帧，作为对应块的pi值，根据重叠区域面积将其分配到各个块，如上图会根据s1,s2,s3和s4所占面积的比例将 $pa_{1,1}^{n}$ 分配到CU00,CU01,CU10和CU11;同时 $pa_{2,1}^{n}$ 分配到CU10,CU11,CU20和CU21；其中 $pa_{1,1}^{n}$ 和 $pa_{2,1}^{n}$ 都会分配一部分到CU10和CU11，只需要将其叠加即可。

计算 $\Delta$ QP

首先将信息分为两类：第一是继承信息，也就是当前块从参考帧获得的信息，参考帧已经编码完成的情况下，通过同一个参考帧和同一个MV获得的参考块也就固定了，得到的信息也就固定了，并不会因为当前块选择不同的编码参数而发生改变；第二是自身产生的信息，从参考块获取了信息之后，当前块会用不同的编码参数，比如QP，merge,skip,AMVP等模式，编码参数不同时，自身产生的信息也就不同。

继续考虑Pn的CU1,1块，当改变当前块的QP时（也就是增加一个 delta QP）， $c_{x,y}^{n+1}(0,0)$ 和 $c_{x,y}^{n+1}(d0,d1)$ 和 $pi_{x,y}{n}$ 都会发生变化，因为他们都包含了自身产生的信息。但是 $c_{x,y}^{n+1}(0,0)-$ c_{x,y}^{n+1}(d0,d1)$不会发生变化，因为他是继承的信息。可以这么来考虑，QP的改变导致残差量化结果发生变化，影响的是当前块预测后的结果，在计算失真的时候还有一个参考块，该参考块是通过MV在参考帧获得的，这个时候参考块已经编码完成，并不会因为当前块QP的改变而发生变化。

当前块的QP发生变化时，后续参考该块的CU都会发生变化，也就是 $pi_{x,y}^{n}$ 也会因为delta QP而产生影响，但是只有新产生的那部分信息 $\frac{c_{x,y}^{n}(d0,d1)}{c_{x,y}^{n}(0,0)}$ 受影响, $(1-\frac{c_{x,y}^{n}(d0,d1)}{c_{x,y}^{n}(0,0)}) \cdot pi_{x,y}^{n}$ 是由继承的那部分信息，传递给后续块的，不受delta QP影响。

参考块因为delta QP受影响的信息量有 $c_{\Delta}=c_{x,y}^{n}(d0,d1)+\frac{c_{x,y}^{n}(d0,d1)}{c_{x,y}^{n}(0,0)} \cdot pi_{x,y}^{n}$
非参考块因为delta QP受影响的信息量有 $c_{x,y}^{n}(d0,d1)$ , 因为非参考块，不被参考，所以后项为0，只有inter cost部份

$\begin{align} & r_{\Delta} = \frac{c_{\Delta}}{c_{x,y}^{n}(d0,d1)}=1+\frac{pi_{x,y}^{n}}{c_{x,y}^{n}(0,0)} \\ & \lambda = -\frac{dD}{dR}=-\frac{dD/dQP}{dR/dQP}=\alpha Qstep^2 \\ & \overline{\lambda} = -\frac{r_{\Delta} \cdot dD}{dR}=\alpha \cdot r_{\Delta} \overline{Qstep}^2 \\ & \lambda = \overline{\lambda} \\ & \frac{\overline{Qstep}^2}{Qstep^2} = \frac{1}{r_{\Delta}} \\ & Qstep^2=b^2 \cdot 2^{\frac{QP-12}{3}} \\ & QP=12 + 3log_{2}^{\frac{Qstep^2}{b^2}} \\ & \overline{QP} = 12 + 3log_{2}^{\frac{\overline{Qstep}^2}{b^2}} \\ & \Delta QP = \overline{QP} - QP = 3log_{2}^{\frac{\overline{Qstep}^2}{b^2}}-3log_{2}^{\frac{Qstep^2}{b^2}} \\ & =3log_{2}^{\frac{\overline{Qstep}^2}{Qstep^2}} \\ & =3log_{2}^{\frac{1}{r_{\Delta}}} = -3log_{2}^{r_{\Delta}} \end{align}$