DeepLearning论文笔记(一):What is the Best Muti-Stage Architecture for object Recognition

本文分析了目标识别模型的layer结构,探讨了非线性、随机滤波器、监督与非监督学习及单层/两层特征提取对识别精度的影响。研究发现,校正层是关键,两层模型优于单层,且非监督预训练加监督调整效果良好。
摘要由CSDN通过智能技术生成

              <<What is the Best Muti-Stage Architecture for object Recognition>>

    一篇比较老的文章,主要描述了目标识别常用模型的layer组成,通过在Caltech-101、NORB、MNIST等数据集上的测试实验体现了non-linearities、Random Filter / hard-wired Filter、监督 / 非监督训练方法、单层特征提取结构 / 两层特征提取结构对于识别精度的影响。具体内容如下:

       首先,作者提出了三个问题:

       1、滤波层后的non-linearities对识别精度有何影响?

       2、用监督或非监督学习方法能否提升Random Filter / hard-wired Filter的效果?

       3、两层特征提取结构效果是否要比单层特征提取结构效果好?

       然后简单介绍了模型的几个常用Layer:

Layer1、滤波层Filter Bank Layer - Fcsg

       这一部分包含了三个部分,即C:卷积滤波器,S:非线性变化函数(sigmoid/tanh),G:增益系数,总体表达为:


         这里文章里计算filter size的时候好像是一处笔误,应该是m2 = n2 - l1 + 1吧~

Layer2、校正层Retification Layer - Rabs

这里用的是绝对值运算,作者表示也尝试过其他的非线性方法,结果差不多。

Layer3、局部对比度归一化层Local Contrast Norma

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值