计算机视觉中词袋模型的应用

最新推荐文章于 2023-07-04 23:30:33 发布

RING�

最新推荐文章于 2023-07-04 23:30:33 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/weixin_44204619/article/details/90146496

版权

本文介绍了计算机视觉中词袋模型（BoW）的应用，包括特征描述（如SIFT）、聚类算法（如K-means）以及在图像检索中的实践。通过提取图像的SIFT特征，构建词汇并进行数据库索引，实现基于欧氏距离的常规查询和使用RANSAC模型的几何验证查询。

摘要由CSDN通过智能技术生成

一、介绍
Bag-of-words model (BoW model) 最早出现在神经语言程序学(NLP)和信息检索（IR）领域. 该模型忽略掉文本的语法和语序, 用一组无序的单词(words)来表达一段文字或一个文档. 近年来, BoW模型被广泛应用于计算机视觉中. 与应用于文本的BoW类比, 图像的特征(feature)被当作单词(Word),把图像“文字化”之后，有助于大规模的图像检索.也有人把简写为Bag-of-Feature model(BOF model)或Bag-of-Visual-Word(BOVW model).
二、基本思想
1、提取特征：根据数据集选取特征，然后进行描述，形成特征数据，如检测图像中的sift keypoints,然后计算keypoints descriptors,生成128-D的特征向量；
在这里插入图片描述
2、学习词袋：利用处理好的特征数据全部合并，再用聚类的方法把特征词分为若干类，此若干类的数目由自己设定，每一个类相当于一个视觉词；

3、利用视觉词袋量化图像特征：每一张图像由很多视觉词汇组成，我们利用统计的词频直方图，可以表示图像属于哪一类。
在这里插入图片描述
三、关键步骤
1、特征描述（关键点提取）