java词袋_计算机视觉中的词袋模型(Bow,Bag-of-words)

最新推荐文章于 2024-04-26 13:30:00 发布

玥霏

最新推荐文章于 2024-04-26 13:30:00 发布

阅读量312

点赞数

文章标签： java词袋

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36163672/article/details/114602156

版权

计算机视觉中的词袋模型(Bow,Bag-of-words)

Bag-of-words

Bag-of-words 模型

之前教研室有个小伙伴在做文本方面的东西，经常提及词袋模型，只知道是文本表示的一种，可是最近看的关于CV的论文中也出现BoW模型，就很好奇BoW到底是个什么东西。

BoW起始可以理解为一种直方图统计，开始是用于自然语言处理和信息检索中的一种简单的文档表示方法。和histogram 类似，BoW也只是统计频率信息，并没有序列信息。而和histogram不同的是，histogram一般统计的某个区间的频数，BoW是选择words字典，然后统计字典中每个单词出现的次数。

比如下面两个文档

John likes to watch movies. Mary likes too.

John also likes to watch football games.

首先可以找出两篇文档中单词的并集，作为dictionary

{"John":1, 'likes':2, "to":3, 'watch':4, 'movies':5, 'also':6, 'football':7, 'games':8, 'Mary':9, 'too':10}

那么两篇文档统计出来的BoW 向量就是

[1,2,1,1,1,0,0,0,1,1]

[1,1,1,1,0,1,1,1,0,0]

BoW model in CV

2003年以来，BoW出现在CV中，如图像分类、图像检索等。

其大概过程首先提取图像集特征的集合，然后通过聚类的方法聚出若干类，将这些类作为dictionary，即相当于words，最后每个图像统计字典中words出现的频数作为输出向量，就可以用于后续的分类、检索等操作。

以sift特征为例，假设图像集中包含人脸、自行车、吉他等，我们首先对每幅图像提取sift特征，然后使用如kmeans等聚类方法，进行聚类得到码本(dictionary)

1477448323465.jpg

之后在每一幅图像中统计sift特征点在码本上的频数分布，得到的向量就是该图像的BoW向量。

1477448445032.jpg

最后就可以使用这些向量进行模式识别的其他操作了。

下图中给出了一个整体的过程

1477448501616.jpg

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。