AAAI 2023 | 浙大成像实验室创建ReLoBlur数据集及LBAG局部模糊感知门控网络

a42773651e07e4ebdf5ba4ba890f4937.gif

单幅图像去运动模糊一直以来都是研究的热点,随着深度学习的兴起,基于端到端学习式的图像去模糊逐渐成为主流。运动模糊可分为全局和局部两类,其中全局运动模糊得到广泛关注,而局部运动模糊问题则较为被忽视。该文章从实际工业应用需求出发,聚焦于解决单图像去除局部运动模糊的多重挑战:

1. 由于缺少公开真实的局部运动模糊数据集,深度学习应用受到阻碍;

2. 训练过程中神经网络模型难以确定局部模糊区域的位置和大小;

3. 当模糊区域仅占少数图像区域时,神经网络会过于关注清晰物体而浪费训练成本。 

为解决上述问题,浙江大学成像工程实验室创建了第一个真实世界局部运动模糊数据集 ReLoBlur,并提出了局部模糊感知门控网络 LBAG 及一系列针对局部运动模糊的解决方案(如 LBFMG、BAPC 等),填补了深度学习在局部运动模糊问题上的空缺。这些创新性的解决方案构建了解决局部运动模糊和全局运动模糊的桥梁,为实际工业应用提供了有效的解决方案。 

该论文的一作李昊颖目前博士在读,师从浙江大学冯华君教授、新加坡南洋理工大学 Chen Change Loy 教授和 Chongyi Li 教授;是此前 SRDiff 的提出者,研究计算机视觉、深度学习和工程光学的交叉领域。

c4490c578fb5919baa07676953120772.png

论文链接:

https://arxiv.org/pdf/2204.08179.pdf

代码链接:

https://github.com/LeiaLi/ReLoBlur

论文主页:

https://leiali.github.io/ReLoBlur_homepage/index.html

效果展示:

下图展示了 ReLoBlur 数据集的部分图像对:

e58ff15894f6c380408dd20c6775af0a.png

下图展示了该文章所提出的 LBAG 方法去除局部运动模糊的效果:

cd528f036a683561dc9fd9ca29d405e6.png

aada1160c14da4dc35ca810898204354.png

方法概览

1.1 ReLoblur数据集

在相机曝光时间内,场景中部分物体的运动叠加造成了图像的局部运动模糊。曝光时间越长,运动模糊越容易积累,图像越模糊;曝光时间越短,运动混叠越少,图像越清晰。

由此原理,该文章设计了一个分光同步拍照装置来同时获取局部运动模糊图像及其对应的清晰图像。该装置包含分光镜、两个相同的工业相机和电源控制模块。其中,相机 B 用长曝光模式来拍摄模糊图像,相机 S 用短曝光模式拍摄清晰图像,拍摄者通过切换相机 B 前的密度片来保证两个相机进光量相同,分光镜可以实现两个相机拍摄的场景一致性。

f56967e3b3a649e53359075ca47b65b6.png

分光拍摄系统经过了精密的设计和装调,但两台相机拍摄的场景仍会存在细微差异。为了校正图像对中除运动模糊区域外的差异,颜色校正、亮度对齐和几何对齐被加入到了图像后处理流程中。图像后处理流程减少了分光拍摄过程中由硬件和环境造成的颜色、光度、空间位置上误差,保证了场景在清晰和模糊图片的一致性。

e7a5cc1ac7f047f62d00703a0172e566.png

数据集中包含生活中常见的拍摄场景,包括但不限于行人、车辆、父母、儿子、宠物、球、植物和家具等。ReLoBlur 已公开训练集图像 2010 对,测试集图像 395 对。同时,作者还用 LBFMG 算法标注了局部运动模糊区域为研究者们提供参考。

ReLoBlur 是第一个实拍的局部运动模糊数据集。与仿真(合成)模糊数据集不同,它真实地展示了局部运动物体自身和背景产生的混叠效应,其中也包含了过曝和较暗的实景图片,以及复杂的模糊边缘。参与这项工作的研究者们花费了大量时间在硬件设计和数据集拍摄上,这些工作为后续解决局部运动模糊问题提供了数据支持。

1.2 局部模糊感知网络(LBAG)

除了 ReLoblur 数据集外,该文章还提出了一个带有局部模糊感知能力的多尺度神经网络模型(LBAG)。多尺度神经网络模型的设计思路来源于 MIMO-Unet [0]。在网络的多尺度输出端增加了一个门控模块用于预测模糊区域。利用 LBFMG 算法生成的掩码作为标签数据来监督训练 LBAG,使得网络具有识别局部模糊区域的能力。 

为了解决网络过于注意非模糊区域的问题(Data imbalance problem),该文章调整了训练数据的输入方式:一半数据随机剪裁输入,一半数据经过 LBFMG 算法定位局部模糊区域后剪裁输入。

b2cd221138570a9b9f35be5447b2779b.png

为更公平地评价去除局部运动模糊效果,出了全局 PSNR 和 SSIM 外,该文章还使用了加权 峰值信噪比 PSNR 和加权结构相似度 SSIM,在局部模糊区域计算 PSNR 和 SSIM:

91009c24f6a55e349030c26eaf534d60.png

其中 、、、 分别为像素位置、图像宽度、图像高度、局部模糊掩码。 和 分别代表了标签图像和网络输出的图像。

1.3 更多结果展示

表 1 不同去模糊方法的量化评价结果(LBAG+表示在 MIMO-UNet 的预训练权重进行训练)。

2062bdde540f884af5926ae49ebbcffb.png

8ebf73564ce12996dbc00e431f2b99a0.png

▲ 图6. 不同去模糊方法在ReLoBlur数据集上的视觉比较

大量实验证明了用 ReloBlur 训练的网络比用合成数据训练的网络表现更好,并且量化评价结果显示 LBAG 网络也超过了其他的 SOTA 方法。 

表 2 合成数据训练的 LBAG+ 和 Reloblur 训练的 LBAG+ 的量化评价结果。

f00ca87edd238eb8dfc7c7cd99abbc56.png

总体而言,该文章挖掘了深度图像复原领域的一个分支:图像局部模糊,创建了第一个局部运动模糊的数据集 ReLoBlur,提出了用于去除局部运动模糊的 LBAG 网络,和一系列适用于真实世界的局部去运动模糊策略,构建了局部运动模糊和全局运动模糊处理的桥梁,为 AI 研究者解决局部图像病态问题提供了新的思路。

outside_default.png

参考文献

outside_default.png

[0] Sung-Jin Cho, etal, Rethinking Coarse-to-Fine Approach in Single Image Deblurring, ICCV 2021

更多阅读

4043acc19838611d183bd6afdcf73f5c.png

27607e0d7466970fc3f44ebd83b8b94e.png

aff9dc97147ac657f69cb3409581f518.png

4aebf7f86c6c8873e099e3223a2b16db.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

ec0231fd83e08a504d17a7ac7bcbdc3f.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

·

9a03ba870981c4e32dcda2fa1b4bc97e.jpeg

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值