计算机视觉面试题复习

本文探讨了CNN在图像识别中优于手工特征的原因,如数据驱动的特征学习、参数共享与稀疏连接带来的平移不变性。同时,文章介绍了卷积神经网络的参数和计算量的计算,并分享了调试、修改模型的经验,包括数据预处理、权重初始化、学习率调整等关键步骤。
摘要由CSDN通过智能技术生成

CNN在图像上表现好的原因

相比于手工特征,

  • CNN可以采用数据驱动的方式学习特征提取,能够提取到更好更丰富的特征。
  • 深层网络可以拟合更复杂的计算,从而提取更复杂更抽象的特征。

相比于普通深度神经网络,

  • 卷积核共享参数,充分利用图像上的空间局部性,因此具有参数共享和稀疏连接两条优点,不容易过拟合。
  • CNN中的池化层还使网络具有平移不变性的特性。
  • 参数共享: 不同图像区域用的卷积核共享一个参数
  • 稀疏连接: 只在卷积视野内连接,不在全图连接
  • 平移不变: 卷积和池化提供了一定的平移不变性(卷积保证了特征图会发生相应的平移,池化使感受野中发生的平移不影响激活信号),但是这样的平移不变性是有限的,因为从信号上看,还是切实发生了变化,有相关研究证明了其在平移时不是严格等价的,且会在一些情况下发生较大的识别结果变化。https://blog.csdn.net/ytusdc/article/details/107666902

理论上,

  • 万能逼近定理: 只要激活函数选择得当,神经元个数足够多的,使用三层神经网络就可以实现对任何一个从输入向量到输出向量的连续映射函数的逼近
  • 卷积神经网络的层次结构与人类视觉认知机制具有一定的一致性。

目前已经证明,视觉皮层具有层次结构。从视网膜传来的信号首先到达初级视觉皮层(primary visual cortex),即V1皮层。V1皮层简单神经元对一些细节

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值