【CV知识学习】【转】beyond Bags of features for rec scenen categories。基于词袋模型改进的自然场景识别方法...

最新推荐文章于 2024-07-25 00:08:05 发布

weixin_30279671

最新推荐文章于 2024-07-25 00:08:05 发布

阅读量131

点赞数

文章标签：人工智能数据结构与算法

原文链接：http://www.cnblogs.com/jie-dcai/p/5740675.html

版权

原博文地址：http://www.cnblogs.com/nobadfish/articles/5244637.html

原论文名叫Byeond bags of features:Spatial Pyramid Matching for Recognizing Natural Scene Categories.

这篇文章的中心思想就是基于词袋模型+金字塔结构的识别算法。首先简单介绍词袋模型。

1.词袋模型

Bag of words模型也成为“词袋”模型，在最初多是用来做自然语言处理,Svetlana在进行图片分类时，使用了“词袋”模型。词袋模型的主要思想是利用每一个“word”的频率作为特征来分类，忽略它的单词顺序和语法、句法等要素。

在图像分类应用时，图像每一个提取出来的特征被当做一个单词来考虑，那么一张图片就是一篇文章的，只不过这个文章是由图片特征组成，在此我们并不考虑特征的前后顺序。

Bag Of Words 主要有两步，第一步基础特征提取，第二步，字典生成（高级特征），最后一步，分类器分类。

1.1基础特征提取

Svetlana在此篇论文中选取的基础特征是SIFT算子，每一个SIFT点会提取一个128维的特征向量。SIFT特征点的提取，和特征向量的计算在其他的博客有所介绍不赘述，本实验代码中提取SIFT特征的代码是用的vlfeat库的vl_sift函数。

1.2 字典生成

基础特征提取之后，我们就获得到了“word”，由于word之间有一定的信息冗余和噪音干扰，并且数据量往往很大，直接用来分类可能效果并不好。因此我们需要设计一些“bag”。在此我们是通过聚类实现的，本文中的聚类方法选择的是K-means算法构造,构造的“bag”数量为400。

生成“bag”之后，我们会将“word”在各个bag中的频率作为一幅图像的特征描述向量。如下图

1.3分类器

分类器选用的是比较简单的线性SVM分类器。

2.金字塔结构

对原始的词袋模型加入金字塔结构。

典型词袋模型只是在原图上进行直方图统计，在金字塔结构中，每一层都会将图像分成不同的区域，分别统计直方图。整个金字塔空间统计出的直方图向量则为最终的特征向量，可以用来分类。示意图如图，此图为3层金字塔结构的直方图统计。

转载于:https://www.cnblogs.com/jie-dcai/p/5740675.html

weixin_30279671

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【CV知识学习】【转】beyond Bags of features for rec scenen categories。基于词袋模型改进的自然场景识别方法...

原博文地址：http://www.cnblogs.com/nobadfish/articles/5244637.html原论文名叫Byeond bags of features:Spatial Pyramid Matching for Recognizing Natural Scene Categories.这篇文章的中心思想就是基于词袋模型+金字塔结构的识别算法。首先简单介绍词袋模...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。