深度学习论文理解1:what is the best multi-stage architecture for Object Recognition

本文分析了卷积结构网络在目标识别中的应用,探讨了非线性变换、filter学习方法和多阶段特征提取对分类效果的影响。实验表明,非线性变换与局部对比归一化对分类至关重要,两阶段网络优于一阶段,无监督预训练结合微调能取得最佳结果。
摘要由CSDN通过智能技术生成

本文是09年,Yann LeCun团队的一篇论文,论文主要讨论了卷积结构网络中各个layer的作用,进而探讨一个好的深度结构分类网络应该是什么样子的。

摘要:在很多目标识别系统的特征提取阶段主要分为三部分:卷积,非线性变换和pooling

本文提出三个问题:

1.卷积层后的非线性变换如何应用分类准确率

2.采用无监督学习的filter,或者监督学的filter比随机权值的filter分类效果更好?

3.多阶段的特征提取好么?

本文最后得出结论:

1,非线性变换和局部对比归一化是非常重要的部分,对于一个好的分类系统。

2,两阶段的网络分类结果比一阶段的好;更让我们惊讶的是,在使用非线性变换和pooling情况下,一个二阶段的随机filter网络也能够产生好的分类结果。

3,unsupervised pretraining +finetuning产生了最好的分类结果。

一.介绍

对于目标识别问题,一般的做法是,先对图像进行特征提取,然后连接分类器进行分类识别。每一次特征提取都作为一个阶段,每次特征提取一般包含如下过程,卷积,非线性变换,归一化和pooling等几个部分。

OR系统有很多模型,单阶段+分类器模型;例如sift,hog等,多阶段+分类器模型;各种模型的主要区别在于:1阶段数(特征提取次数),非线性变换类型;filter来源(随机,监督,无监督,人工选择),顶层分类器。直觉上,认为一个纯粹的参数较多的监督学习系统可能会由于标签数据量较小而导致不好的结果;特征提取中的filter需要仔细的挑选(或者训练)才能产生好的分类结果,然而这些直觉是错误了。

二目标识别系统模型

特征提取阶段

1,卷基层(Convolution)

卷基层详细的介绍参见前面博客

Filter来源

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值