BOF算法原理
BOF介绍
BOF(Bag of features),即图像特征词典。
Bag of Feature 是一种图像特征提取方法,它借鉴了文本分类的思路(Bag of Words),从图像抽象出很多具有代表性的「关键词」,形成一个字典,再统计每张图片中出现的「关键词」数量,得到图片的特征向量。
「Bag of Feature」的本质是提出一种图像的特征表示方法。
根据「Bag of Feature」算法的思想,首先我们要找到图像中的关键词,而且这些关键词必须具备较高的区分度。实际过程中,通常会采用「SIFT」特征。
Bag of Feature 算法过程
「Bag of Feature」大概分为四步:
1、 提取图像特征
2、 对特征进行聚类,得到一部字典( visual vocabulary );
3、 根据字典将图片表示成向量(直方图);
4、 训练分类器或者用 KNN 进行检索(这一步严格来讲不属于「Bag of Feature」的范畴)。
BOF过程浅析
1、提取图像特征
首先特征提取。前文提到了,是要利用sift特征提取方法。
2、学习“视觉词典”
得到图像特征后进行聚类,得到视觉词典
3、根据特征集进行量化
针对输入特征集,根据视觉词典进行量化
BOF算法测试
测试数据集1
首