course 2 week1 初始化、正则化、梯度校验
course 2 week2 优化算法
()、[]、{}
()代表的是训练集的个数,[]代表的是神经网络层数的个数、{}代表的是不同mini-batch的个数
course 2 week3 batch norm&tensflow入门
1.使用batch norm预测时,针对z^~=Y*z^(i)+B中的Y和B两个超参数的选择问题
预测时,对z^~进行修正需要Y和B但因为这样需要你去遍历一次训练集才能获得较好的Y和B否则只有一个exmaple的Y和B会出现误差的问题(单个样本对集体有误差),所以在训练时需要记录好每一层的Y和B并且需要使用移动平均(别的平均也行)来获得B和Y