核心思想
该文主要介绍了一种通过无监督学习方式实现兴趣点检测,可以用于特征描述以及特征点匹配等任务。作者认为对于兴趣点的检测应该具备一定的鲁棒性,即对于光照、尺度变化不敏感,即使经过一定变换后仍可以保留原有特征。该文首先使用神经网络将图像中的点映射到一个实数响应值,并根据响应值的大小对点进行排序,然后对变换后的图像在进行响应值的计算,并排序。根据上面的介绍,一个好的兴趣点检测方法,图像在映射前后响应值的大小顺序应该是不变的,如果一个点在原图中的响应值大于另一个点,那么在变换后的图像中该点的响应值也应该大于另一个点。最后就选择响应值顺序不变的点作为兴趣点。
d
d
d表示图像或图像中的物体,
p
d
i
p^i_d
pdi表示
d
d
d上的点,
t
∈
T
t\in T
t∈T表示一种变换方式,
t
(
d
)
t(d)
t(d)表示变换后的图像,
H
(
p
∣
w
)
H(p|w)
H(p∣w)表示一种映射函数(该文中通过神经网络实现),其中
p
p
p表示用于映射的点,
w
w
w表示网络参数。根据上文的介绍,对于每个四元点集
(
p
d
i
,
p
d
j
,
p
t
(
d
)
i
,
p
t
(
d
)
j
)
(p^i_d,p^j_d,p^i_{t(d)},p^j_{t(d)})
(pdi,pdj,pt(d)i,pt(d)j)应满足以下顺序约束
网络训练的目的就是获得一种好的映射函数,使得两个点的响应值能够在变换前后满足顺序约束。为了实现训练的目标,首先制定一个顺序约束函数
当四元点集满足顺序约束时,上式
R
>
0
R>0
R>0,否则
R
<
=
0
R<=0
R<=0。根据上式制定了损失函数
采用铰链损失函数的形式。
算法评价
本文主要是提出一种兴趣点检测算法,对变换前后的图像对应点的响应值进行排序,并根据顺序约束选择兴趣点。
如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。