softmax输出层(m个输入,n个输出):
Z=WX+B
(其中W为系数矩阵(
n×m
),B为n维偏置量,X为m维输入向量,Z为n维向量)
yj=ezj∑mj=1ezj
j∈[1,n]
如果使用最小平方和loss函数:
E=∑nj=112(yj−Yj)2
偏导数为:
∂yi∂zi=yi(1{i=j}−yj)
∂E∂zi=∑nj=1σyj⋅∂yi∂zi=∑nj=1σyj⋅yi⋅(1{i=j}−yj)
如果使用softmax交叉熵loss函数:
E=−∑nj=1Yjlogyj
求偏导数:
∂E∂zi=∑nj=1∂E∂yj∂yj∂zi=σyj=yi−Yi