计算机视觉面试题复习

Woolseyyy

已于 2022-02-13 14:28:17 修改

阅读量738

点赞数

分类专栏：计算机视觉文章标签：计算机视觉 cnn 人工智能

于 2020-02-20 11:49:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Woolseyyy/article/details/104405556

版权

本文探讨了CNN在图像识别中优于手工特征的原因，如数据驱动的特征学习、参数共享与稀疏连接带来的平移不变性。同时，文章介绍了卷积神经网络的参数和计算量的计算，并分享了调试、修改模型的经验，包括数据预处理、权重初始化、学习率调整等关键步骤。

摘要由CSDN通过智能技术生成

CNN在图像上表现好的原因

相比于手工特征，

CNN可以采用数据驱动的方式学习特征提取，能够提取到更好更丰富的特征。
深层网络可以拟合更复杂的计算，从而提取更复杂更抽象的特征。

相比于普通深度神经网络，

卷积核共享参数，充分利用图像上的空间局部性，因此具有参数共享和稀疏连接两条优点，不容易过拟合。
CNN中的池化层还使网络具有平移不变性的特性。

参数共享：不同图像区域用的卷积核共享一个参数

稀疏连接：只在卷积视野内连接，不在全图连接

平移不变：卷积和池化提供了一定的平移不变性（卷积保证了特征图会发生相应的平移，池化使感受野中发生的平移不影响激活信号），但是这样的平移不变性是有限的，因为从信号上看，还是切实发生了变化，有相关研究证明了其在平移时不是严格等价的，且会在一些情况下发生较大的识别结果变化。https://blog.csdn.net/ytusdc/article/details/107666902

理论上，

万能逼近定理：只要激活函数选择得当，神经元个数足够多的，使用三层神经网络就可以实现对任何一个从输入向量到输出向量的连续映射函数的逼近
卷积神经网络的层次结构与人类视觉认知机制具有一定的一致性。

目前已经证明，视觉皮层具有层次结构。从视网膜传来的信号首先到达初级视觉皮层（primary visual cortex），即V1皮层。V1皮层简单神经元对一些细节

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。