Bag of features

最新推荐文章于 2022-06-18 22:02:49 发布

yuyaoshiniba

最新推荐文章于 2022-06-18 22:02:49 发布

阅读量253

点赞数

本文链接：https://blog.csdn.net/yuyaoshiniba/article/details/106314245

版权

本文介绍了Bag of Words模型的概念及其在图像处理中的应用——Bag of Features模型。详细阐述了从特征提取、聚类生成视觉词典、直方图表示到训练分类器的步骤，并通过代码示例展示了SIFT特征提取和视觉词典建立的过程。实验结果显示，Bag of Features在图像匹配中可能存在特征位置信息丢失的问题，可能导致匹配误差。在实际操作中遇到了pysqlite2未安装的问题，通过pip install解决了此问题。

摘要由CSDN通过智能技术生成

原理

Bag of Words

在这里插入图片描述
词袋模型起先应用在文本处理领域。给定的文本中，提取出关键词，然后统计每个关键词出现的次数，然后根据每个关键词在每个文档中出现的次数，将关键词表示成向量的形式。例如一个稳定中有五个关键词，这个文档中的每一个关键词出现的次数依次写下就是记录成一个向量的形式。每一个关键词都是相互独立的，那么整个文档就可以表示成关键词出现频率的集合

Bag of features

Bag-of-Features模型仿照文本检索领域的Bag-of-Words方法，把每幅图像描述为一个局部区域/关键点(Patches/Key Points)特征的无序集合。使用某种聚类算法(如K-means)将局部特征进行聚类，每个聚类中心被看作是词典中的一个视觉词汇(Visual Word)，相当于文本检索中的词，视觉词汇由聚类中心对应特征形成的码字(code word)来表示（可看当为一种特征量化过程）。所有视觉词汇形成一个视觉词典(Visual Vocabulary)，对应一个码书(code book)，即码字的集合，词典中所含词的个数反映了词典的大小。图像中的每个特征都将被映射到视觉词典的某个词上，这种映射可以通过计算特征间的距离去实现，然后统计每个视觉词的出现与否或次数，图像可描述为一个维数相同的直方图向量，即Bag-of-Feature

Bag of features步骤

1.提取图像特征；
2.对特征进行聚类，得到可视化字典(visual vocabulary)；
3.根据字典将图片表示成向量，即直方图；
4.使用得到的直方图表示的特征进行分类器的训练。

特征提取
首先我们从原始图像中提取特征，如图4所示。常用的特征提取方法有SIFT，SURF。SIFT得到的特征描述是128维度的向量，相比SISF，SURF计算量更小些，得到的特征是64维的向量。也有使用HoG和LBP来进行特征提取的。注意特征提取的方法要满足旋转不变性以及尺寸不变性。

字典生成
对所有的图片提取完特征后，将所有的特征进行聚类，比如使用K-Means聚类，得到K类，每个类别看作一个word，这样我们就得到了字典，
直方图表示
上一步训练得到的字典，是为了这一步对图像特征进行量化。对于一幅图像而言，我们可以提取出大量的特征，但这些特征(如SIFT提取的特征)仍然属于一种浅层的表示，缺乏代表性。因此，这一步的目标，是根据字典重新提取图像的高层特征。具体做法是，对于每一张图片得到的每一个特征(如SIFT提取的特征)，都可以在字典中找到一个最相似的word(实际上就是将特征输入到得到的聚类模型，得到类别)，统计相似的每种word的数量，于是就得到一个K维的直方图。
训练分类器
对于每张图片，我们得到了其对应的直方图向量，当然也知道其对应的属于哪种物品的标记。这样我们就可以构造训练集来训练某种分类器。当需要进行预测时，我们先测试集的图片中提取特征，然后利用字典量化得到直方图，输入训练好的分类器，得到预测的类别。

代码

sift提取特征并建立视觉词典

# -*- coding: utf-8 -*-
import pickle
from PCV.imagesearch import vocabulary
from PCV.tools.imtools import get_imlist
from PCV.localdescriptors import sift

#获取图像列表
imlist = get_imlist('D:/Study/untitled1/shiyan/')
nbr_images = len(imlist)
#获取特征列表
featlist = [imlist[i][:-3]+'sift' for i in range(nbr_images)]

#提取文件夹下图像的sift特征
for i in range(nbr_images):
    sift.process_image(imlist[i], featlist[i])

#生成词汇
voc = vocabulary.Vocabulary('ukbenchtest')
voc.train(featlist, 1000,

最低0.47元/天解锁文章

yuyaoshiniba

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Bag of features

文章目录原理bag of wordsbag of featureBag of features步骤Bag of Feature 的缺点特征提取字典生成直方图表示训练分类器代码sift提取特征并建立视觉词典原理bag of words词袋模型起先应用在文本处理领域。给定的文本中，提取出关键词，然后统计每个关键词出现的次数，然后根据每个关键词在每个文档中出现的次数，将关键词表示成向量的形式。例如一个稳定中有五个关键词，这个文档中的每一个关键词出现的次数依次写下就是记录成一个向量的形式。每一个关键词都是
复制链接

扫一扫