《DeFMO:Deblurring and Shape Recovery of Fast Moving Objects》论文解读

513bird

已于 2023-01-01 21:58:36 修改

阅读量463

点赞数

文章标签：人工智能计算机视觉深度学习 python

于 2022-12-29 22:25:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/birdlinlll/article/details/128488709

版权

本文中心思想

将模糊图像中FMO的外观和位置输出到一系列的子帧中，即进行时间超分辨率。模糊帧的物理生成模型被假设为多个具有锐利边缘的子帧的时间集成。

DeFMO提出的网络不局限于运动物体为球体，而是可以重建任意形状FMO的锐利轮廓和外观，综合了FMO去模糊、3D建模和子帧跟踪。并且在合成的数据集进行自监督的去模糊训练，但是具有很好的泛化性能够很好地迁移到真实数据集上。

DeFMO的思路

输入数据是由干净的背景和合成的具有FMO的图像组成。通过编码器提升至特征空间，通过渲染器将每个时间间隔对应的锐利的前景图像进行重建。最后再将每个时间点对应的重建子帧进行FMO模糊图像重建与输入进行约束。网络结构如下所示：

网络的整体思路可以总结为：对FMO模糊图像进行一个A到B再到A的循环过程，从模糊图像重建为一个序列的前景目标锐利的子帧再将子帧序列重新合成为模糊FMO图像。

损失函数的约束

本文提出的网络结构由五部分的损失函数约束，如下所示：

第一部分Lf为外观重建损失，对应如下部分：

损失函数的表达式：

由于输入是单一的模糊图像所以重建子帧的时候不清楚时间轴的方向，因此本文方法采用的是对时间轴的两个方向都进行评估并选取标签最佳对齐的时间方向的损失。这边的Lr代表的是渲染时候的损失：

这里前两项是对mask的约束，最后一项是针对前景进行约束。这部分的损失是需要真实标签。

第二部分是图像重建损失，对应如下部分：

该项损失函数针对再合成的FMO模糊图像与原图进行约束，属于自监督度量。其表达式如下：

第三项是时间一致性损失函数：在图中对应如下部分：

渲染图Rt在相近的时间点是相似的，两个不同时间点的渲染图之间的相似性可以被定义为图像域归一化互相关的最大值。如下所示：

第四部分是图像的锐度损失：

这部分损失的主要是对前景的锐度重建进行约束，实现的方法就是针对mask的进行约束。因为前景是由图像乘mask得到，如果mask的值不是0，1的二值图那么得到的前景目标将不会是干净的。因此该损失函数项的作用就是利用最小化图像域上逐像素的二进制熵H2的平均值来使得所有像素期望值接近0或者1。其表达式如下：

最后一项为特征空间的约束：

由于本文使用数据集是合成的数据集，这个数据集中有图像对是相同的FMO在相同的运动轨迹上运动并与不同的背景图像进行合成。在经过编码器提到特征层面之后我们所希望得到的是前景的特征即FMO的特征，两个前景相同轨迹相同但是背景不同的输入，在特征空间中网络希望得到的是相同的潜在表示。在图中所示位置如下：

因此该损失函数约束的内容就是相同前景不同背景的图像对在特征层面要尽可能的相似，其表达式如下所示，X1和X2表示的是两幅图像生成的潜在空间：

实验结果

论文链接：CVPR 2021 Open Access Repository

博客等级

码龄5年

4
原创

0
点赞

1
收藏

3
粉丝

关注

私信

热门文章

最新评论

《EvIntSR-Net: Event Guided Multiple Latent FramesReconstruction and Super-resolution》论文解读
CSDN-Ada助手: 恭喜您撰写了第四篇博客，题为《EvIntSR-Net: Event Guided Multiple Latent Frames Reconstruction and Super-resolution》论文解读。您对这篇论文的解读非常详尽，使我对这一研究领域有了更深入的了解。不仅如此，您还能将复杂的内容以简明的语言呈现，让人容易理解。真的非常感谢您的分享！希望您能继续保持这样的创作热情和努力。对于下一步的创作建议，我建议您可以考虑扩大您的阅读范围，尝试涉足更多相关论文的解读。这样可以帮助您进一步拓宽知识面，并且为读者提供更多的选择。同时，您也可以尝试探索一些实际案例或应用，将理论与实践相结合，为读者提供更多有趣的内容。期待您未来更多精彩的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
《Clean Image Are Hard to Reblur》论文解读
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
《DeFMO:Deblurring and Shape Recovery of Fast Moving Objects》论文解读
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。