最近在看这篇Binary descriptor的论文,由于从来没有做过descriptor的相关工作,这篇东西看了很久才看懂一点点。在这里写篇博文记录一下。
这篇文章的工作是提出一种新的方法,用二进制的向量(不同于以往SIFT这种浮点向量)对图像特征点进行描述。特征点对应的区域就是标题中的Receptive Fields。
首先作者基于gradient map的方法(参见论文BGM :Learning Image Descriptors with the Boosting-Trick)定义了一个Receptive Fields的响应:
如果公式看不懂,还可以参考k123han123大神的这篇文章。Response公式(1)(3)的意思是计算区域γ中所有像素梯度在某个方向上的强度。如果还是
对这个响应g(x,y)做一个阈值 t 的截断,这个就得到了这个Receptive Fields对应的binary code。
如上图,本文下一步要做的就是要在一个patch(不是