【十二】 H.266/VVC | 帧间预测技术 | 双向光流技术BDOF

最新推荐文章于 2024-01-22 20:35:32 发布

Cohen_ina

最新推荐文章于 2024-01-22 20:35:32 发布

阅读量1.2k

点赞数

分类专栏： VVC/H.266

本文链接：https://blog.csdn.net/weixin_45615071/article/details/107186452

版权

VVC/H.266 专栏收录该内容

24 篇文章 72 订阅

订阅专栏

一、前言

双向光流技术是由JEM参考模型中的BIO技术发展而来，相较于BIO，BDOF计算的复杂度更低，尤其是乘法运算数量和乘数大小更小。

作用：用来修正CU的4 * 4子块CU的双向预测信号。

说明：BDOF基于光流的概念，它假设物体的运动是平滑的。对于每个4 * 4的子块，通过使前向预测L0和后向预测L1的预测值的差值最小来计算运动修正量 $Vx,V_y)$ ，然后用计算出来的修正值来调整4 * 4子块的双向预测值。同时该技术仅应用与亮度分量。

二、使用条件

BDOF用于在4 * 4子块级别上优化CU双向预测信号，如果BDOF满足一下所有条件，则将BDOF应用于CU：

使用“真正的“双向预测模式，即两个参考帧的一帧在当前帧之前，另一帧在当前帧之后
两个参考帧到当前帧的距离（即POC差）是相同的
两个参考帧均为短期参考帧
CU未使用Affine模式或ATMVP模式进行编码
CU需要超过64个亮度像素值（4*16这种形式不可取）
CU高度和宽度均大于或者等于8
对于BCW权重，要求等权重
当前CU未启用加权预测
当前CU不适用CIIP模式或TPM模式

三、具体实现

3.1 计算水平和垂直梯度

对前向和后向预测值分别计算水平和垂直梯度，梯度值直接通过相邻值相减得到，具体公式实现如下：

$\frac{\partial I^{\left( k \right)}}{\partial x}\left( i,j \right) \,\,=\,\,\left( \left( I^{\left( k \right)}\left( i+1,j \right) \right) \,\,>>\,\,shift1 -\,\,\left( I^{\left( k \right)}\left( i-1,j \right) \right) \,\,>>\,\,shift1 \right)$
$\frac{\partial I^{\left( k \right)}}{\partial y}\left( i,j \right) \,\,=\,\,\left( \left( I^{\left( k \right)}\left( i,j+1 \right) \right) \,\,>>\,\,shift1 -\,\,\left( I^{\left( k \right)}\left( i,j-1 \right) \right) \,\,>>\,\,shift1 \right)$
$I^{\left( k \right)}\left( i,j \right) 是Lk\left( k=0,1 \right) \text{中坐标}为\left( i,j \right) \text{处的预测值}$
$shift1=\max \left( 6,bitDepth-6 \right) ,bitDepth是\text{亮度分量的比特深度}$

3.2 计算梯度的自相关和互相关

计算梯度的自相关和互相关 $S_1、S_2、S_3、S_4、S_5、S_6$

$S_1=\sum_{\left( i,j \right) \in \varOmega}{\psi _x\left( i,j \right) \cdot \varPsi _x\left( i,j \right)}$

$S_2=\sum_{\left( i,j \right) \in \varOmega}{\psi _x\left( i,j \right) \cdot \varPsi _y\left( i,j \right)}$

$S_3=\sum_{\left( i,j \right) \in \varOmega}{\theta \left( i,j \right) \cdot \varPsi _x\left( i,j \right)}$

$S_5=\sum_{\left( i,j \right) \in \varOmega}{\varPsi _y\left( i,j \right) \cdot \varPsi _y\left( i,j \right)}$

$S_6=\sum_{\left( i,j \right) \in \varOmega}{\theta \left( i,j \right) \cdot \varPsi _y\left( i,j \right)}$

其中：

$\theta \left( i,j \right) =\left( I^{\left( 1 \right)}\left( i,j \right) >>n_b \right) -\left( I^{\left( 0 \right)}\left( i,j \right) >>n_b \right)$

$n_a=\min \left( 1,bitDepth-11 \right)$

$n_b=\min \left( 4,bitDepth-8 \right)$

$\varOmega 是\text{环绕}4 * 4\text{子块的}6 * 6\text{的窗口}$

3.3 使用互相关和自相关的结果计算运动修正值 $V_x,V_y)$

$v_x=S_1>0?clip3\left( -th'_{BIO},-th'_{BIO},-\left( \left( S_3\cdot 2^{n_b-n_a} \right) >>\lfloor \log _2S_1 \rfloor \right) \right) :0$

$v_x=S_5>0?clip3\left( -th'_{BIO},-th'_{BIO},-\left( \left( S_6\cdot 2^{n_b-n_a}-\left( \left( v_xS_{2,m} \right) <<n_{S_2}+v_xS_{2,s} \right) /2 \right) >>\lfloor \log _2S_5 \rfloor \right) \right) :0$

其中：

$S_{2,m}=S_2>>n_{S_2}$

$S_{2,s}=S_2\&\left( 2^{n_{S_2}}-1 \right)$

$th'_{BIO}=2^{\max \left( 5,BD-7 \right)}$

$n_{S_2}=12$

$\lfloor \cdot \rfloor 是\text{向下取整操}作$

3.4 计算修正之后的预测值

$b\left( x,y \right) =rnd\left( \left( v_x\left( \frac{\partial I^{\left( 1 \right)}\left( x,y \right)}{\partial x}-\frac{\partial I^{\left( 0 \right)}\left( x,y \right)}{\partial x} \right) \right) /2 \right) +rnd\left( \left( v_y\left( \frac{\partial I^{\left( 1 \right)}\left( x,y \right)}{\partial y}-\frac{\partial I^{\left( 0 \right)}\left( x,y \right)}{\partial y} \right) \right) /2 \right)$

$pred_{BDOF}\left( x,y \right) =\left( I^{\left( 0 \right)}\left( x,y \right) +I^{\left( 1 \right)}\left( x,y \right) +b\left( x,y \right) +offset \right) >>shift$

注意：上式在计算中乘数不超过15比特，且在计算BDOF的过程中中间参数最多不超过32比特

3.5 边缘梯度计算方法

在第一步计算梯度的过程中，在计算边缘像素点的梯度时会超出当前CU的边界。为了解决这个问题VTM在使用BDOF时会在CU的边界扩展一行/列，如下图所示，为了控制生成扩展预测值的复杂度，扩展区域（白色位置）的值直接使用最近的整像素位置的参考值，不需要进行插值计算。对于CU内部区域（灰色位置）用8抽头滤波器进行插值计算。这些扩展值仅用于梯度计算，对于BDOF后续的计算步骤，如果需要使用CU边界之外的任何样本和梯度值，则从其最近的像素中进行填充（即重复）

在这里插入图片描述

注意：

当亮度CU的宽、高大于16时，需要将其划分为宽、高等于16的子块，在BDOF处理的过程中子块的边界被当做CU边界。BDOF能处理的最大块为16 * 16
如果当前块启用了BCW，即BCW权重索引指示权重不相等，则将禁用双向光流。同样，如果对于当前块启用WP，即，对于两个参考图片中的任意一个，luma_weight_lx_flag标志为1，则也禁止使用双向光流。当CU用对称MVD模式和CIIP模式编码时，禁止使用双向光流