深度学习解决的问题
自动提取出最合适的特征
深度学习应用
神经网络基础
损失函数
前向传播
反向传播
绿色字体为正向传播i输入,红色字体为反向传播梯度
MAX门单元只把梯度传给最大的
神经网络整体架构
激活函数
隐藏层激活函数
一般选择Relu,sigmoid会出现梯度消失现象
神经网络中防止过拟合
-
Dropout可以作为训练深度神经网络的一种trick供选择。在每个训练批次中,通过忽略一半的特征检测器(让一半的隐层节点值为0),可以明显地减少过拟合现象。这种方式可以减少特征检测器(隐层节点)间的相互作用,检测器相互作用是指某些检测器依赖其他检测器才能发挥作用。
Dropout说的简单一点就是:我们在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作,这样可以使模型泛化性更强,因为它不会太依赖某些局部的特征