BoW(Bag-of-Features)特征袋对图像进行分类的理解

特征袋的思想

BoW(Bag-of-Features)[1]算法是由Csurka等在2004年提出并应用于图像处理领域的,该算法广泛应用于目标识别和图像检索。算法主要思想借鉴了文本检索的思想。在检索文本的过程中,文本由一系列的基本单元组成,这个单元通常是单词;同理,一副图像也可以看成是由一系列的基本单元组成,这些图像中的基本单元称为视觉单词(visual words)。
如图1所示
这里写图片描述

特征袋分类的思考

对于一个的静态手势,可以看作是由多个视觉单词组成。例如需要对1、 2这两个不同的静态手势进行分类。那么首先需要知道1这个手势是由哪些单词组成,2这个手势由哪些单词组成,而这些单词用的是英文单词还是中文单词,这就需要构建视觉词典。构建完视觉词典后我们就开始对1这个这手势进行查字典,设字典只有26个字母,手势1一查1个O、1个N、一个E。手势2一查1个T、1个W、1个O。好的,现在我有两个类在这了。假如你搞一个手势和1比较相似的手势,我就按字母个数分布与哪个相似这个标准来分类判断。比如搞个手势由1个O、1个N、一个T组成,你看,有两个单词和1完全吻合,一个单词和2完全吻合,那肯定和1比较像。我就判断这个手势是手势1。

[1] Csurka G, Dance C, Fan L, et al. Visual categorization with bags of keypoints[C]//Workshop on statistical learning in computer vision, ECCV. 2004, 1(1-22): 1-2.

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值