SIFT
sift处理图像返回关键点的描述子(128×n),一般为128维,n个关键点,每个描述子表达了一个局部区域的信息,经过sift提取,将一幅图片表达为一些碎片的集合。一个描述子可看作为一个小碎片。
BoW
1.生成codebook
对图像数据集做sift特征提取,用k-means聚类,得到 k entries 的codebook,
2.reprensentation
对一幅新的图片,sift提取特征,假设为128×M(M描述子)
- coding:对每一个提取出来的描述子用字典的词重构,使得重构误差最小,得到k维的向量,即为该描述子的编码。处理完所有的描述子得到M×k的矩阵特征。
- pooling:
- average-pooling:对将上一步得到的矩阵按列取平均得到1×k,则一幅图片被表达为1×k的向量特征
SPM
BoW获得的128×k的字典即代表有k类特征。对图片进行多尺度的划分,0,1,2···L。如在l尺度下,图片被划分为2^l ×2^l 个小块,在每一个小块下统计各类特征的个数,