bag of words

2人阅读 评论(0) 收藏 举报


       
最初的Bag of words,也叫做“词袋”,在信息检索中,Bag of words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择的。

       现在Computer Vision中的Bag of words来表示图像的特征描述也是很流行的。大体思想是这样的,假设有5类图像,每一类中有10幅图像,这样首先对每一幅图像划分成patch(可以是刚性分割也可以是像SIFT基于关键点检测的),这样,每一个图像就由很多个patch表示,每一个patch用一个特征向量来表示,咱就假设用Sift表示的,一幅图像可能会有成百上千个patch,每一个patch特征向量的维数128。
      接下来就要进行构建Bag of words模型了,假设Dictionary词典的Size为100,即有100个词。那么咱们可以用K-means算法对所有的patch进行聚类,k=100,我们知道,等k-means收敛时,我们也得到了每一个cluster最后的质心,那么这100个质心(维数128)就是词典里德100 个词了,词典构建完毕。
      词典构建完了怎么用呢?是这样的,先初始化一个100个bin的初始值为0的直方图h。每一幅图像不是有很多patch么?我们就再次计算这些patch和和每一个质心的距离,看看每一个patch离哪一个质心最近,那么直方图h中相对应的bin就加1,然后计算完这幅图像所有的 patches之后,就得到了一个bin=100的直方图,然后进行归一化,用这个100维的向量来表示这幅图像。对所有图像计算完成之后,就可以进行分类聚类训练预测之类的了

查看评论

彻底掌握 Javascript(十九)Iterator 迭代器【专家辅导】

ES6 引入了 Iterator 迭代器,这是很重要的特性,所有相关javascript的类,都实现了这个接口,从而可以利用 for-of 来循环,具体的看课程吧,很有用的特性。
  • 2017年06月30日 20:59

Bag of words and Bag of features

关于BOW没什么好点资源,百度到的都是一些不详细的。 碰巧看到了一个公开课,http://crcv.ucf.edu/courses/CAP5415/Fall2012/index.php里面有视频和PD...
  • langb2014
  • langb2014
  • 2015-09-17 09:45:25
  • 3046

Bag of Words

转自:http://zipperary.com/2013/12/10/bow/ Bag of Words,即词袋模型,是对样本数据的一种表示方法,主要应用在 NLP(自然语言处理)和...
  • smartlinuxc
  • smartlinuxc
  • 2015-03-03 16:35:14
  • 508

Bag of words(matlab实现)

其实前面就是kmeans,然后Hard voting。关于kmeans不细说了,就是更新中心的过程,一直到类心变化在误差范围内。 kmeans聚类时用的训练数据中center个随机数据初始化,后面用的...
  • yiqiwangxi
  • yiqiwangxi
  • 2015-08-31 19:35:08
  • 1884

Bag Of Visual Words 三大步

第一步:Feature detection
  • tangwei2014
  • tangwei2014
  • 2014-08-05 22:24:44
  • 1664

Bag of Words模型

这几天忙里偷闲看了一些关于BOW模型的知识,虽然自己做图像检索到目前为止并没有用到过BOW模型,不过了解一下BOW并不是一件毫无意义的事情。网上关于理解BOW模型也很多,而且也很详细,再写一点关于BO...
  • GarfieldEr007
  • GarfieldEr007
  • 2016-01-01 08:27:25
  • 1128

一篇给力的Bag-of-words模型入门介绍文章~

SIFT算法的应用 -目标识别之用Bag-of-words模型表示一幅图像   作者:Savitch 出处:http://blog.csdn.net/assiduousknig...
  • wsj998689aa
  • wsj998689aa
  • 2015-07-27 18:57:04
  • 11531

关于bag of words 的初步理解

from: http://blog.sciencenet.cn/blog-261330-627219.html     [转载]SIFT算法的应用--目标识别之Bag-of-words模型(转)  ...
  • lovely_juzi
  • lovely_juzi
  • 2013-09-15 23:38:39
  • 1115

Bag-of-words模型原理

BoW模型最初应用于文本处理领域,用来对文档进行分类和识别。BoW 模型因为其简单有效的优点而得到了广泛的应用。其基本原理可以用以下例子来给予描述。给定两句简单的文档: 文档 1:“我喜欢跳舞,小明也...
  • u012507022
  • u012507022
  • 2016-09-05 19:17:29
  • 7026

the bag of words representation —— Python Data Science CookBook

In order to do machine learning on text, we will need to convert the text to numerical feature vecto...
  • you1314520me
  • you1314520me
  • 2017-02-11 00:17:27
  • 880
    个人资料
    持之以恒
    等级:
    访问量: 3420
    积分: 175
    排名: 104万+
    最新评论