多标签多物体识别

CNN在识别单个物体方面取得了显著的发展,但如果只用CNN的话,在识别多个物体方面会遇到瓶颈。下面罗列了一些识别一张图片中多个不同的物体的方法,主要是结合CNN、RPN、LSTM,以及和RPN有类似作用的BING。

  1. HCP(hypothesis-CNN-Pooling):BING算法+shared CNN。BING算法生成object proposal。shared CNN网络采用imageNet(单独标签的)数据进行了预训练。
    在这里插入图片描述

  2. RLSD(Regional Latent Semantic Dependencies)可以看做是CNN+RPN(region proposal network)+LSTM. 用于多标签图片分类,即识别一张图片中的多个物体与类别。CNN采用的VGGNET。

在这里插入图片描述

  1. Mask R-CNN:RPN+CNN。Mask R-CNN是两步,第一步是RPN。第二步,CNN提取特征,并行预测分类和box offset,同时对每个ROI输出一个二进制蒙版(mask)。

  2. CNN+RNN(LSTM)。比如进行多文字识别的CRNN,基于CNN+RNN+CTC。

  3. CNN+SVM。OverFeat obtained very competitive performance in the image classification task of ILSVRC 2013。

  4. Multi-label CNN:就是一个CNN,只是最后的分类全连接层的维度换成可以识别多个物体。

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI强仔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值