Knowledge Guided Disambiguation for Large-Scale Scene Classification With Multi-Resolution CNNs》阅读笔记

本文提出了一个多分辨率CNN框架,结合粗分类和细分类网络,用于解决大规模场景分类中的标签歧义问题。通过混淆矩阵进行类别聚类和额外网络产生的soft标签,提高了分类准确性。在ILSVRC2015, Places2和LSUN挑战赛中取得优秀成绩。" 110868866,7000229,使用Element UI的el-tree组件动态控制增删按钮,"['vue.js', 'element ui', '前端开发', '组件控制']
摘要由CSDN通过智能技术生成

《Knowledge Guided Disambiguation for Large-Scale Scene Classification With Multi-Resolution CNNs》阅读笔记

图像分类中遇到的困难,以及针对这些困难本文方法的优势在哪里?
场景分类中遇到的困难:
1、场景的类别常常通过多个信息(局部目标,全局布局,背景信息)综合确定,这使得分类的类间差距很大。
2、随着场景类别的增多,在大规模图像分类中,标签的歧义称为另一关注的焦点。
论文的贡献:
1、提出(由相互补充的粗分辨率CNN和精细分辨率CNN构成的)多分辨率CNN框架以获得多阶段的视觉信息和结构。
2、设计了两个消除标签歧义的技术:1)根据验证集合上混淆矩阵提供的信息将标签有歧义的多个类和并成一个超级大类。2)利用额外的网络产生每张图像的soft标签。接着利用超级类或者soft标签指导CNN的训练。
2、 本文方法获得的成就。
1、 ILSVRC2015, Places2挑战赛的第二名。
2、 CVPR2016, LSUN挑战赛的第一名
3、 论文评价提出的方法在MIT Indoor67和SUN397数据集上,准确率分别为86.7%, 72.0%。
分类的准确率
这里写图片描述
本文方法具体是怎么做的ÿ

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值