Fast Image Processing with Fully-Convolutional Networks

  • 研究目的

使用CNN模拟传统图像处理中的各类算子,加速处理图像的速度


  • 数据准备

input数据是样本对集(I,f(I)),I为各分辨率图像, f(I)是经过对应算子处理过的结果,即标签


  • 损失函数

回归的均方差损失函数


  • 网络结构

网络使用扩张卷积,示意图中以6层网络为例

实际网络结构如下:

网络中间层通道数为w,w>3,dilatation值逐层指数级增加,倒数两层dilatation为1。

最后一层卷积核为1x1,用以减少通道数至3,其余层都是3x3


  • 训练相关

为保证训练出的模型适用于各种大小的图片,训练时会将图片随机resize到任意大小(不改变纵横比)

该模型还使用了自适应的BN以代替传统BN

和传统BN作用于各层非线性函数(该网络使用leaky RELU)之前不同,AN作用于非线性函数之后


  • 网络扩展应用

    • 参数网络

  在原有input图像RGB三通道的基础上增加一个通道,训练时该通道的值随机取,使得用该网络inference时,可通过调整该通道的值控制图像处理结果的优劣

  • 单模型模拟多种算子(paper中模拟10种)

上文所述的都是用网络模拟单一算子的效果,实际上可以实现单网络模拟多算子,以10种为例。在原有input图像RGB三通道的基础上增加10通道。生成训练数据时,随机选择一种算子,同时将对应通道都设为1,其余通道为0(类似分类用的one-hot标签)。这样可以使得在inference阶段通过人为设定10通道的值选择对应的算子。同时inference时,这些通道可以不遵守one-hot要求(e.g.[0.7,0.3,0,0,…,0]),获得多算子叠加的过渡效果。

  • 作用于视频

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值