一、实验原理
BoW(Bag-of-Features)算法是由Csurka等在2004年提出并应用于图像处理领域的,该算法广泛应用于目标识别和图像检索。算法主要思想借鉴了文本检索的思想。在检索文本的过程中,文本由一系列的基本单元组成,这个单元通常是单词;同理,一副图像也可以看成是由一系列的基本单元组成,这些图像中的基本单元称为视觉单词(visual words)
BAG OF FEATURES算法流程
(1)特征提取:通过sift算法提取图像特征
(2)学习“视觉词典”
(3)针对输入特征集,根据视觉词典进行量化。
(4)把输入图像,根据TF-IDF转化成视觉单词(visual words)的频率直方图。
(5)构造特征到图像的倒排表,通过倒排表快速索引相关图像
(6)根据索引结果进行直方图匹配。
二、代码实现
# -*- coding: utf-8 -*-
import pickle
from PCV.imagesearch import vocabulary
from PCV.tools.imtools import get_imlist
from PCV.localdescriptors import sift
#获取图像列表
imlist = get_imlist('ukbench/')
nbr_images = len(imlist)
#获取特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]
#提取文件夹下图像的sift特征
for i in range(nbr_images):
sift.process_image(imlist[i], featlist[i])
#生成词汇
voc = vocabulary.Vocabulary('test77_test')
voc.train(featlist, 65, 10)
#保存词汇