可视化理解CNN
- 保存层级的网络结构。
- 不同层级有不同形式运算和功能。
CNN优缺点
优点
- 局部感知的共享卷积核,轻松处理高维参数。
- 特征属性不敏感,特征值通过训练权重得到。
- 通过深层次的网络,可以抽取更丰富的图像信息,具有更好的表达效果。
缺点
- 需要调参和大量样本,训练迭代次数较多,使用GPU训练最佳。
- 物理含义不明确,很难从每层输出看出含义。
参数初始化
CNN中,神经元之间的连接通过权重ω和偏置b实现,且ω、b的取值直接影响模型训练速度和训练精度。
权重的初始化
建议方式: 随机数很小。多层深度神经网络中,值太小导致回传梯度很小。
- 服从均值为0,方差较小的高斯分布随机数列。2/n,n为权重数量。
- Xavier 服从均匀分布的随机数列。
错误方式:
全部初始化为0,即全部设置为0,在反向传播时梯度值一样,导致网络权重无法差异化,就无法学习到东西。
注意:
- Weight Standarization即权重ω标准化,类似批归一化,是对权重系数做标准化操作,让模型效果更好。
- 卷积和FC操作前,对ω做标准化操作。卷积操作中以每个卷积核为单位计算均值 μ 和标准差 σ 。
- FC操作时,以当前层次的所有权重为单位计算均值 μ 和标准差 σ 。
偏置项的初始化
一般直接设为0,网络中存在RLU激活函数时,可以设为一个很小的正数。
Xavier
nj:输入维度数目。 nj+1:输出维度数目。