一:整体思路
数据库建立:
1. 提取图像的SIFT特征
2. 将所有特征集合起来进行Kmeans聚类
3. 求出各个聚类的聚类中心并存入文件(高版本的opencv的Kmeans无需此步骤)
4. 记录下每个图片文件的聚类词频 ( FIle1 :
class1: n1
class2: n2 class3.......)
5. 建立倒排索引表 (
class1: file1: n1 file2: n2 file3:.....)
查询:
1. 提取文件的SIFT特征
2. 对每一个特征与kmeans中心匹配,求出匹配的class ,并根据匹配程度做权值记录表。
3. 根据权值表和倒排索引表求出最佳匹配项