用词袋（bag of word）实现场景识别

最新推荐文章于 2024-07-28 00:47:29 发布

shore5

最新推荐文章于 2024-07-28 00:47:29 发布

阅读量7.7k

点赞数 1

分类专栏：算法机器视觉 matlab

本文链接：https://blog.csdn.net/wanjinchang/article/details/49612945

版权

前段时间在standford university的计算机视觉：算法与应用这门课上做了一个小作业——利用词袋实现场景识别（Scene recognition with bag of words），下面整理如下：一、词袋模型最先是由Josef等基于自然语言处理模型而提出的。这一模型在文档分类里广为应用，通过统计each word的frequency来作为分类器的特征。类

摘要由CSDN通过智能技术生成

前段时间在standford university的计算机视觉：算法与应用这门课上做了一个小作业——利用词袋实现场景识别（Scene recognition with bag of words），下面整理如下：

一、词袋模型

最先是由Josef等基于自然语言处理模型而提出的。这一模型在文档分类里广为应用，通过统计each word的frequency来作为分类器的特征。类比一篇文章由很多文字(textual words) 组合而成，如果將一張图片表示成由许多视觉单词（visual words）组合而成，就能将过去在文本检索（text retrieval）领域的技巧直接利用在图像检索（image retrieval）中，以文字检索系统现在的效率，图像表示的“文字化”也有助于大规模(large-scale)图像检索系统的效率。

下面通过一个简单的例子来说明词袋在文本处理中的应用：

如下两篇简单的文档;

基于这两篇文档建立一个字典（Dictionary）如下：

易见这个字典由10个distinct word构成，将其作为indexes，我们可将两篇文档表示为如下的10-entry vector：

通俗的讲：

Bag-of-words model实际就是把文档表示成向量,其中vector的维数就是字典所含词的个数，在上例中，vector中的第i个元素就是统计该文档中对应（字典）dictionry中的第i个单词出现的个数，因此可认为BoW model就是统计词频直方图的简单文档表示方法。

二、词袋模型在计算机视觉中的应用

类别识别的最简单的算法之一是词袋（bag of words，也称

最低0.47元/天解锁文章

shore5

关注

1
点赞
踩
24

收藏

觉得还不错? 一键收藏
2
评论
用词袋（bag of word）实现场景识别

前段时间在standford university的计算机视觉：算法与应用这门课上做了一个小作业——利用词袋实现场景识别（Scene recognition with bag of words），下面整理如下：一、词袋模型最先是由Josef等基于自然语言处理模型而提出的。这一模型在文档分类里广为应用，通过统计each word的frequency来作为分类器的特征。类
复制链接

扫一扫

专栏目录