计算机视觉--图像检索与识别

最新推荐文章于 2024-02-14 11:23:03 发布

weixin_48882021

最新推荐文章于 2024-02-14 11:23:03 发布

阅读量534

点赞数 1

文章标签： python 计算机视觉

本文链接：https://blog.csdn.net/weixin_48882021/article/details/125352981

版权

前言

一、基本原理

1.1 Bag-of-words模型

1.2 Bag-of-features模型

1.3 Bag-of-features算法

1.4 Bag-of-features基础流程

1. 特征提取

2. 学习 “视觉词典（visual vocabulary）”

3. 针对输入特征集，根据视觉词典进行量化

4. 把输入图像转化成视觉单词（visual words）的频率直方图

5. 构造特征到图像的倒排表，通过倒排表快速索引相关图像

前言

本次实验是基于Bag-of-words模型实现的简单图像检索操作。

一、基本原理

1.1 Bag-of-words模型

Bag-of-words词袋模型最初被用在信息检索领域，对于一篇文档来说，假定不考虑文档内的词的顺序关系和语法，只考虑该文档是否出现过这个单词。假设有5类主题，我们的任务是来了一篇文档，判断它属于哪个主题。在训练集中，我们有若干篇文档，它们的主题类型是已知的。我们从中选出一些文档，每篇文档内有一些词，我们利用这些词来构建词袋。我们的词袋可以是这种形式：{‘watch’,'sports','phone','like','roman',……}，然后每篇文档都可以转化为以各个单词作为横坐标，以单词出现的次数为纵坐标的直方图，之后再进行归一化，将每个词出现的频数作为文档的特征。

1.2 Bag-of-features模型

Bag of Feature 也是借鉴了这种思路，只不过在图像中，我们抽出的不再是一个个word，而是图像的关键特征Feature，所以研究人员将它更名为Bag of Feature。
Bag of Feature在检索中的算法流程和分类几乎完全一样，唯一的区别在于，对于原始的 BOF 特征，也就是直方图向量，我们引入TF-IDF 权值。