Key.Net: Keypoint Detection by Handcrafted and Learned CNN Filters(2019)(十三)

最新推荐文章于 2024-09-12 07:46:31 发布

lizhaohu01

最新推荐文章于 2024-09-12 07:46:31 发布

阅读量2.9k

点赞数 4

分类专栏： deepfeature 文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010260681/article/details/108486315

版权

deepfeature 专栏收录该内容

14 篇文章

订阅专栏

本文提出一种结合传统特征检测方法与深度学习的新型特征检测器，旨在提升检测器的鲁棒性和稳定性。通过在多尺度图像上应用像素梯度导数并融合CNN层，形成最终响应图。利用局部极大值抑制和多尺度窗口一致性损失，实现跨图匹配的一致性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文要解决的问题：

本文主要解决 detector 问题，为什么要解决这个问题呢？目前已知的detector的 可重复性检测不鲁棒

作者分析是没有像fast等这样使用像素的梯度信息，因此本文提出了一种 新的方法解决detector问题。

本文主要的贡献：

提出了一种融合传统detector方法和deeplearning的方法的特征detector 器，更加鲁棒稳定健壮。

首先是整体框架：

网络框架很简单，首先为了 仿照金字塔，对原始图像降采样+高斯blur（3层scale），然后在每个scale上进行网络学习。

然后每个输入首先执行像素上的梯度的一阶导数，得到一个feature map层，然后执行像素的二阶导数得到一个feature map层。

再然后经过几层CNN层，最后上采样到原始image 大小。再然后每个scale层累加融合，得到最终的一层W*H*1的response map

上述 融合两层的像素梯度导数层是第一个创新

然后看下loss：

将response层分割成grid，每个grid为N*N的windows大小（上述图片N=8），然后在每个小windows中进行局部极大值抑制。

1）首先对respondse的score进行归一化：

其中i表示这个windows的编号，wi(u, v)表示坐标u v处的响应值（类似superpoint）

2）然后直接“回归”出keypoint在这个小的windows中的坐标：

i还是表示windows的编号（那么也就是每个windows将会获得一个keypoint的候选），cw表示这个windows的左上角坐标

好了有了上述结果就可以类似别的deeplearning使用homograph”弱监督”的惩罚两张图的detector不一致性获得loss了：

其中a，b表示输入的两张图H表示之间的变换，xi，yi表示这个windows上的keypoint位置，R表示响应值。（上述就是两张图的keypoint的一致性）

为了使用multi-scale的windows因此做了不同的windows，如下图所示：

loss将会统计每个不同scale的windows的一致性

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。