训练样本有m个,输入为x,输出为y,L表示神经网络的层数,
Sl
S
l
表示每层neuron个数,
SL
S
L
表示输出层神经元个数,k也可以表示为输出层神经元的个数.
相比逻辑回归里的代价函数,其实就是多了多分类加和.
梯度下降法,使得代价函数最小
神经网络总结