《Deep Learning》From 《Nature》
author:Yann lecun, Yoshua bengio, Geoffery Hinton
第二课时:
CNN、基于CNN的图像理解
1.卷积神经网络基础
输入信号的维度:
1D:序列和信号,包括语言信息等。
2D:平面图像、声音频谱图等。
3D:视频信号、立体图像等。
卷积神经网络的关键:
1.信号的局部连接;
2.共享权重;
3.降采样;
4.多层网络结构;
卷积神经网络主要层次结构:
卷积层:
·卷积的输出被称作特征映射
·卷积核共享权重
·卷积神经网络具有稀疏交互性
这样设计的好处:
·数组形式的数据(例如图像),局部值之间是高度相关 的,形成容易检测的各种局部图形
·图片和其他信号数据的局部统计特征具有位置不变性
池化层:
·将邻域内语意相近的的特征进行融合
·常见池化操作:Max-pool,Average-pool
·当前一层特征组件发生位置变化或表现变化,降低当前 蹭的表征变化。
通常将2-3个卷积层+非线性激活函数+池化层作为一个模块;一个模型通常包含多个