说在前面的话:
1)这里面的w1和w2分别与x1和x2相乘,是矩阵乘积的结果
2)x是3维图片像素压缩成二维以后的行向量(链接:通过吴恩达作业里识别猫的程序——了解矩阵降维的原理_nyist_yangguang的博客-CSDN博客)
3)a就是下面的sigmoid函数,dz是,da是,这个符号是L,达子写的太飘逸了,这样标记的目的为了区分不同符号的偏微分
4)视频图片中出现的d在多个变量中指的是偏微分(小写d的花体),达子为了降低视频观看门槛,统一写成d。
前向传播的时候:
记住导数的含义,dw是在这一点的斜率,梯度下降发会让w朝着J(w)全局最小值方向移动。
得到上图很多求导结果,均是偏微分求导,其中最重要的涉及到一个函数,sigmoid函数的求导,推导如下:
其中就是a,也是sigmoid函数表达式。