目录 一、复习(BP算法) 二、训练模型的建议 三、参数设置内容 1、随机梯度下降(SGD) 2、激活函数的选择 (1)sigmoid (2)tanh双曲正切函数 3、训练数集初始化 4、(w,b)的初始化 1)什么是梯度消失现象? 2)什么是梯度爆炸现象? 3)如何对w,b进行初始化来避免梯度消失? >>>问题1:怎么从区间中均匀随机取值? 5、Batch Normalization(不懂) 6、目标函数的选择处理