一、图像检索方法流程
- 流程 :构建特征库,构建索引,图像检索
构建索引的一个例子是,倒排索引,所谓倒排索引:就是利用稀疏的特征值代替文件编号作为索引值,可以提高检索的效率) - 核心方法:特征提取,近邻查找
- 特征提取:全局特征、局部特征
全局特征与局部特征需要不同的检索方法,如果是全局特征可以直接通过欧式距离进行相似性比较,局部特征一般包含:特征点和特征描述符,则需要对局部的特征点进行匹配,匹配过程更加复杂。 - 查找方法:近邻查找,近似最近邻查找方法(ANN)
二、几种典型的特征提取方法
2.1 BOF(bag of feature)
这种方法起源于文本分析中的BOW方法,其主要过程分为以下几步:
-
使用surf生成图像的特征描述点和特征描述点的特征描述符
-
使用聚类算法将上述特征描述符进行聚成K类,每一类生成一个聚类中心
-
将描述符与各个聚类中心进行计算欧式距离,选择最近的距离,在该聚类中心内的频数上加1,生成频数表
-
通过tf-idf对频数进行加权,生成最终的BOF
- 词频(Term frequency,TF)给定词在文件中出现的次数。例如tf=3/100表示包括100个词语的文档中,词语Z出现了3次。
- 逆文档频率(inverse Document F