图像检索知识整理(传统方法)

图像检索知识整理

本文是对传统的图像检索方法、特征提取、描述子生成、匹配的方法进行部分总结

1. SIFT特征提取

1.1 尺度空间生成

L ( x , y , σ ) = G ( x , y , σ ) ∗ I ( x , y ) L(x,y,\sigma) = G(x,y,\sigma) *I(x,y) L(x,y,σ)=G(x,y,σ)I(x,y)
G ( x , y , σ ) = 1 2 π σ 2 e − ( x 2 + y 2 ) 2 σ 2 G(x,y,\sigma) = \frac{1}{2\pi\sigma^2}e^{\frac{-(x^2+y^2)}{2\sigma^2}} G(x,y,σ)=2πσ21e2σ2(x2+y2)

1.2 检测尺度空间极值点

1.3 精确定位极值点

D ( x , y , σ ) = D ( x , y , σ ) + ∂ D T ∂ x x + 1 2 x T ∂ 2 D ∂ x 2 D(x,y,\sigma) = D(x,y,\sigma)+\frac{\partial D^T}{\partial x}x+\frac{1}{2}x^T\frac{\partial^2 D}{\partial x^2} D(x,y,σ)=D(x,y,σ)+xDTx+21xTx22D
求导得:
x ^ = − ∂ 2 D − 1 ∂ x ∂ D ∂ x \hat x =-\frac{\partial^2 D^{-1}}{\partial x}\frac{\partial D}{\partial x} x^=x2D1xD

1.4 为每个关键点指定方向参数

利用关键点领域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性
m ( x , y ) = ( L ( x + 1 , y ) − L ( x − 1 , y ) ) 2 + ( L ( x , y + 1 ) − L ( x , y − 1 ) ) 2 m(x,y)=\sqrt{(L(x+1,y)-L(x-1,y))^2+(L(x,y+1)-L(x,y-1))^2} m(x,y)=(L(x+1,y)L(x1,y))2+(L(x,y+1)L(x,y1))2
每个关键点三信息:位置、所处尺度、方向

1.5 关键描述子生成

以特征点为中心取 8 * 8的领域作为采样窗口,将采样点与特征点相对方向归入。

最后得到 8 * 8 *8的向量转换 [1, 128] 向量的描述子。

2. 匹配方法:词袋模型(BOW)

词袋模型(Bag of Words),是通过计算特征词频,利用词频反映图像全局特征,用于后续匹配的方法。对SIFT特征点放在一起进行聚类,得到代表性聚类中心(单词)、做词频统计(Term frequency)统计。
TF:词频统计
IDF:做完词频TF统计后,为了降低停用词带来的干扰,可以再算上个逆文档词频IDF,给TF乘上一个权重。
然后L2归一化,用内积做相似性度量。
在这里插入图片描述

缺点:未考虑位置因素,是特征的0阶统计

3.Fisher Vector

将一个样本图片概率分布表示为各个特征维度上面的概率分布乘积
L ( x ∣ λ ) = ∑ t = 1 T l o g p ( x t ∣ λ ) L(x|\lambda)=\sum_{t=1}^{T}{logp(x_t|\lambda)}\\ L(xλ)=t=1Tlogp(xtλ)
对高斯分布的变量求偏导:
y t i = w i u i ( x t ) ∑ j = 1 K w j u j ( x t ) y_{t_i}=\frac{w_iu_i(x_t)}{\sum_{j=1}^{K}{w_ju_j(x_t)}\\} yti=j=1Kwjuj(xt)wiui(xt)
∂ L ( x ∣ λ ) ∂ w i = ∑ t = 1 T [ y t ( i ) w i − y t ( 1 ) w 1 ] , f o r i ≥ 2 \frac{\partial L(x|\lambda)}{\partial w_i} =\sum_{t=1}^{T}{[\frac{y_t(i)}{w_i}-\frac{y_t(1)}{w_1}]}, for i\ge2\\ wiL(xλ)=t=1T[wiyt(i)w1yt(1)],fori2
∂ L ( x ∣ λ ) ∂ u i d = ∑ t = 1 T y t ( i ) [ x t d − u i d ( σ i d ) 2 ] \frac{\partial L(x|\lambda)}{\partial u_i^d} =\sum_{t=1}^{T}y_t(i){[\frac{x_t^d-u_i^d}{(\sigma_i^d)^2}]}\\ uidL(xλ)=t=1Tyt(i)[(σid)2xtduid]
∂ L ( x ∣ λ ) ∂ σ i d = ∑ t = 1 T y t ( i ) [ x t d − u i d ( σ i d ) 3 − 1 σ i d ] \frac{\partial L(x|\lambda)}{\partial \sigma_i^d} =\sum_{t=1}^{T}y_t(i){[\frac{x_t^d-u_i^d}{(\sigma_i^d)^3}-\frac{1}{\sigma_i^d}]}\\ σidL(xλ)=t=1Tyt(i)[(σid)3xtduidσid1]
分布结合梯度方向

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值