[VP] BOW 词袋模型 Bag Of Words

最新推荐文章于 2022-05-16 21:41:24 发布

是土豆大叔啊！

最新推荐文章于 2022-05-16 21:41:24 发布

阅读量199

点赞数

分类专栏：计算机视觉CV 文章标签：聚类机器学习可视化深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/potato_uncle/article/details/115273914

版权

计算机视觉CV 专栏收录该内容

26 篇文章 3 订阅

订阅专栏

BOW词袋模型

词典学习-用聚类学习Visual Word
- 1、特征提取
- 2、学习可视化词典-K-means聚类
编码-为每个图像建立BOW向量
- 1、将图像特征与Visual Word联系起来
- 2、直方图-统计Visual Word出现的次数
训练-用BOW训练和测试数据

词典学习-用聚类学习Visual Word

1、特征提取

可以用 SIFT 作特征提取

在这里插入图片描述

2、学习可视化词典-K-means聚类

在这里插入图片描述

然后就可以用 K-means 方法提取的特征做聚类，具体步骤如下:

1、在数据中初始化各类的中心点
2、计算每个特征点离哪个中心点最近，将特征点的类别划分为其中心点的类
3、重新计算每个类中特征点的公共平均点，回到步骤2
4、重复步骤2直到没有变化，即为最终结果

在这里插入图片描述

编码-为每个图像建立BOW向量

1、将图像特征与Visual Word联系起来

在这里插入图片描述

2、直方图-统计Visual Word出现的次数

在这里插入图片描述

训练-用BOW训练和测试数据

1、KNN

简单说就是，在测试点周围选定一个距离，在这个距离内的K个其他点，哪个类的点多，测试点就是哪个类

其超参数有两个：K值和 距离函数
在这里插入图片描述

K值：用Cross-validation来决定 K
常用 距离函数 如下：

在这里插入图片描述

2、Linear Classifier

简单说，就是用线性函数 $f(x_{i},W,b)=Wx_{i}+b$ 计算分数，哪个类分数大就是哪个类

在这里插入图片描述

接下来的问题是，如何知道 $W$ 是好是坏？我们可以使用损失函数来评估其结果！然后用优化方法使损失最小化！

3、SVM

SVM作为损失函数：

$L_{i}= \sum_{j \neq y_{i}} \Biggl\{ \begin{aligned} 0 & \; \; \text{ if } s_{y_{i}} \ge s_{j} + 1\\ s_{j}- s_{y_{i}} + 1 & \; \; \text{ othewise } \end{aligned} \Bigr. = \sum_{j \neq y_{i}} max(0 , s_{j}- s_{y_{i}} + 1 )$

$\frac{1}{N} \sum_{i=1}^{N} L_{i}$

是土豆大叔啊！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
[VP] BOW 词袋模型 Bag Of Words

BOW词袋模型词典学习-用聚类学习Visual Word1、特征提取2、学习可视化词典-K-means聚类编码-为每个图像建立BOW向量1、将图像特征与Visual Word联系起来2、直方图-统计Visual Word出现的次数训练-用BOW训练和测试数据1、KNN2、Linear Classifier3、SVM词典学习-用聚类学习Visual Word1、特征提取可以用 SIFT 作特征提取2、学习可视化词典-K-means聚类然后就可以用 K-means 方法提取的特征做聚类，具体步
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

是土豆大叔啊！ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。