成本函数 J(w,b)的定义 ==>
一个平均值,从i=1到m的损失函数L之和的平均值。其中,这个损失函数L是当算法在样本(x,y)上输出了 ai。
ai是训练样本的预测值,也就是sigmoid(zi)
在之前,我们做的是对于任意单个训练样本,如何计算导数,即当值有一个训练样本时,计算dw1(i),dw2(i),db(i)。
已知全局成本函数是一个求和的过程,从1到m项的损失函数和的平均值。由此可知 ==>
全局成本函数 J(w,b) 对 w1 的导数 就等于 >
这个导数看起来复杂,其实
这个部分,在之前就已经计算过,就是如何对单个训练样本进行计算,即>
所以,