Fine-Grained Classification之车型识别

先说这篇文章,Monza: Image Classification of Vehicle Make and ModelUsing Convolutional Neural Networks and Transfer Learning,该文章使用了3DObject Representations for Fine Grained Categorization这篇文章的车型数据集,一共16185张图像(train:8144,test:8041),共196种车型,文章分析了各种现有的模型,最终识别结果如下,可以看出,googLeNet具有最好的性能。

 

之后分析这篇文章,A Large-Scale Car Dataset for Fine-Grained Categorizationand Verification

文章提出了自己的一个车型数据集CompCars,可惜需要高校申请,没有开源。

http://mmlab.ie.cuhk.edu.hk/datasets/comp_cars/index.html),该数据集一共1716种车型,共136726张图片,从作者的实验结果可以看出,最高的识别率是64.3%。

 

下来就是这篇15年的ICCV,Bilinear CNNs for Fine-grained Visual Recognition(B-CNN),该文章首次提出了特征外积的思想,并且可以实现端到端的训练,在Caltech-UCSD birds ,NABirds, FGVC aircraft ,Stanford cars 等数据集上分别获得了84.1%,79.4%,86.9% ,91.3%的准确性。

 

正如上图所示,一幅图像经过A,B两个卷积后,进行了外积操作,在经过均值池化操作,获得了bilinear向量,最后经过softmax输出最终结果。

然后就是这篇文章2017的cvpr,Low-rank Bilinear Pooling for Fine-Grained Classification(LRBP),该文章是改进的compactbilinear,大大的减少了计算量和模型的大小,当然只有很少的精度损失。

 

最终的识别精度如下,也就是在第一个196种车型数据集上达到了90.92%的识别精度

 

本人自己的改进,使用resnet-Inception+LRBP的思想,并对原始的LRBP进行了改进,对网络进行了调整修改,融合了3个网络结果,输出了最终的结果。终于可以投paper了。

 

实验测试效果如下,

 

references:

http://www.vision.caltech.edu/visipedia/CUB-200-2011.html

https://github.com/gy20073/compact_bilinear_pooling

https://github.com/aimerykong/Low-Rank-Bilinear-Pooling

 

 

 

 

  • 10
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值