《FMODetect:Robust Detection of Fast Moving Objects》论文解读

513bird

已于 2023-01-01 21:57:39 修改

阅读量232

点赞数

文章标签：目标检测深度学习计算机视觉

于 2022-12-29 23:33:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/birdlinlll/article/details/128489382

版权

本文将FMO检测任务划分成检测＋抠图＋去模糊的任务，并且能够实现实时检测。

思路总结

本文方法类似于双阶段目标检测算法，双阶段目标检测算法例如Fast-RCNN。第一阶段先通过RPN找到感兴趣的区域然后第二阶段对感兴趣的区域内进行目标框的回归以及类别的分类。而本文的算法可以理解为先对疑似FMO的区域进行筛选和裁剪操作，然后对小范围进行FMO的判别、轨迹拟合以及抠图。将抠图解码得到的图像块再进行后续的去模糊。之所以本文能实现实时检测，个人认为主要原因是其与双阶段目标检测的原理类似，通过减小检测的范围从而实现高速检测。

网络结构

检测网络

检测网络的输入是带有FMO的模糊图像以及背景图像，输出是每个像素点与FMO轨迹的距离函数，如下所示：

这里的目的就是对整幅图像有可能是FMO的区域进行筛选。如图中所示，像素点距离运动轨迹越远检测网络输出该像素点对应的值就越大。本来运动轨迹是一条直线，网络输出的距离函数会显示为一个区域，这个区域就是可能含有FMO物体的区域。网络的损失函数约束如下：

抠图和拟合网络

检测网络输出的结果需要进行阈值的筛选，然后对小于阈值的部分进行裁剪，并针对具有FMO的图像和背景图像都进行相应的裁剪。再将三个裁剪的结果一起送入抠图和拟合网络中，抠图和拟合网络由一个编码器和三个解码器组成。三个解码器对应的是抠图解码器，其输出是前景图像和其对应的mask；判别解码器，其输出是是否为FMO的二分类结果；最后是拟合解码器，其输出是FMO的运动轨迹。其网络结构如下图所示：

抠图解码器这块就是普通的监督学习；拟合解码器这块本文主要针对三种轨迹情况进行建模，分别是直线、抛物线和分段的具有反弹性质的直线，如下所示：

轨迹为直线时c2和c3都为0；抛物线的时候c3为0；分段直线的时候c2为0。

整个抠图和拟合网络的损失函数分别对三个解码器的输出进行约束，其损失函数如下：

去模糊网络

去模糊网络本文将该问题描述为一个优化问题，如下所示：

针对前景与mask和模糊核H进行交替优化，最终输出去模糊的结果。

实验结果

论文链接： ICCV 2021 Open Access Repository

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《FMODetect:Robust Detection of Fast Moving Objects》论文解读

针对ICCV2021文章《FMODetect: Robust Detection of Fast Moving Objects》的个人解读，欢迎大家交流！
复制链接

扫一扫

513bird CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

160万+: 周排名

66万+: 总排名

844: 访问

: 等级

40: 积分

3: 粉丝

0: 获赞

3: 评论

1: 收藏

私信

关注

热门文章

最新评论

《EvIntSR-Net: Event Guided Multiple Latent FramesReconstruction and Super-resolution》论文解读
CSDN-Ada助手: 恭喜您撰写了第四篇博客，题为《EvIntSR-Net: Event Guided Multiple Latent Frames Reconstruction and Super-resolution》论文解读。您对这篇论文的解读非常详尽，使我对这一研究领域有了更深入的了解。不仅如此，您还能将复杂的内容以简明的语言呈现，让人容易理解。真的非常感谢您的分享！希望您能继续保持这样的创作热情和努力。对于下一步的创作建议，我建议您可以考虑扩大您的阅读范围，尝试涉足更多相关论文的解读。这样可以帮助您进一步拓宽知识面，并且为读者提供更多的选择。同时，您也可以尝试探索一些实际案例或应用，将理论与实践相结合，为读者提供更多有趣的内容。期待您未来更多精彩的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
《Clean Image Are Hard to Reblur》论文解读
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
《DeFMO:Deblurring and Shape Recovery of Fast Moving Objects》论文解读
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。