《Fast End-to-End Trainable Guided Filter》阅读笔记

1. 介绍

这篇论文主要是将引导滤波的思想引入到了网络之中,先在小图上进行学习,再通过在引导滤波器上学习针对特定任务的引导图实现对生成小图上采样,最后恢复大图。这种思想在Deep bilateral里面已经使用过,但是这篇论文里生成的大量仿射系数使得速度受到了限制。

论文:https://arxiv.org/abs/1803.05619
代码:https://github.com/wuhuikai/DeepGuidedFilter

2. Guided Filtering Layer

先看一下引导滤波层,令输入高分辨图为 I h I_h Ih,低分辨图为 I l I_l Il,输出的低分辨图为 O l O_l Ol, 高分辨图为 O h O_h Oh,那么在引导滤波里学习的线性变换系数分别令为 A l A_l Al b l b_l bl, 通过最小化输入和输出的损失可以计算得到这些系数,则有:
O l i = a l k I l i + b l k O_l^i=a_l^kI_l^i+b_l^k Oli=alkIli+blk
其中i是像素的标号,k是引导滤波里局部窗口的标号。 A h A_h Ah b h b_h bh A l A_l Al b l b_l bl上采样得到的,这样输出的高分辨图也可以通过线性公式获得,如下所示:
O h = A h ∗ I h + b h O_h=A_h*I_h+b_h Oh=AhIh+bh

下面到正式的引导滤波层,如下图所示, A l A_l Al b l b_l bl通过一个均值滤波器 f u f_u fu和局部线性模型 I l I_l Il O l O_l Ol得到,然后通过上采样获得 A h A_h Ah b h b_h bh。然后线性组会 A h A_h Ah b h b_h bh以及 I h I_h Ih得到输出 O h O_h Oh。因此,O_h可以通过反向传播到 A h A_h Ah b h b_h bh以及 I h I_h Ih,进而可以通过引导滤波层直接训练得到 O l O_l Ol的网络。
在这里插入图片描述
上图中蓝色线代表前向,黄色线代表后向,令r为均值滤波的半径设为0.1,ϵ为正则化系数设为1e-8,算法流程图如下所示:
在这里插入图片描述
上图中的算法3,4步和引导滤波求解a,b公式对比,发现几乎完全一样。
在这里插入图片描述
其中, O l O_l Ol O l ‾ \overline{O_l} Ol对应p, p ‾ \overline{p} p G l ‾ \overline{G_l} Gl Σ G l \Sigma{G_l} ΣGl对应于 μ \mu μ, σ 2 \sigma^2 σ2
最后在引导层里引入了F(I),实现层中的转换(如上图所示),其由两层组成,可以根据不同的任务训练得到不同的效果。

3. Deep Guided Filtering Network

将上述部分和前面学习低分辨的网络部分结合在一起,称为DGF,结构图如下图所示:
在这里插入图片描述
其中前面提取低分辨特征的网络使用的是CAN。首先将原始的引导滤波上采样称为DGFs,其不可训练。然后引入上面提到的引导滤波层,这里的的F(I)都是一个恒等变换函数,称为DGFb。最后,导入上面提出的两层F(I),称为DGF。在图像处理的训练里,将损失函数定义为L2 loss。训练中,其为了获得更好的泛化性能,使用了512s到1672s大小不等的图片作为训练集。而下采样后统一变成64s大小。

4.实验结果

在运行速度和内存使用上和deep bialteral以及CAN的对比如下图所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DcrBFSJf-1579694141649)(https://i.loli.net/2018/09/22/5ba5f0c03b0d2.png)]
在不同任务上的效果对比如下所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pvCl281J-1579694177553)(https://i.loli.net/2018/09/22/5ba5f120220ea.png)]
可以看出有些任务上表现不好,这说明这类任务不适合在低分辨下进行处理。此外有些任务在DGF上表现更好,说明这些任务是依赖分辨率的。此外,结果也说明使用不同分辨大小图片作为输入会取得更好的效果,这里不再赘述。

5. 最后

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值