机器学习门槛之矩阵求导(四) 对常见的矩阵求导公式进行了证明,但是可以看出每次求导都去查矩阵求导公式市比较繁琐的,推荐这个简书上的矩阵求导总结,是我见到的最容易理解的矩阵求导资料。
机器学习中的矩阵、向量求导www.jianshu.com![39ada7c8ccaa357b8c6030aefc7fc7fc.png](https://img-blog.csdnimg.cn/img_convert/39ada7c8ccaa357b8c6030aefc7fc7fc.png)
接下来进行逻辑斯蒂回归的求导:
逻辑斯蒂回归矩阵求导
注意:
输入数据:
![fa2fc35c33ebe46ced00c0b9ceeafd13.png](https://img-blog.csdnimg.cn/img_convert/fa2fc35c33ebe46ced00c0b9ceeafd13.png)
数据的lable:
参数:
模型输出:
输入和输出的矩阵形式关系:
即输入和输出的关系:
逻辑斯蒂回归采用二分类的交叉熵损失函数:
loss的矩阵形式:
注意:
步入正题,矩阵求导:
机器学习就是参数估计,需要求出
输入:
label:
输出:
前向传播:
损失函数:
矩阵求导的反向传播 :
(第一步)
则:
注意:这里的实数对向量求导采用分母布局!!!
(第二步)
则:
即:
化简可得:
(第三步)
因为:
所以:
(第四步)
因为:
所以:
总结:
逻辑斯蒂回归模型
输入:
label:
输出:
前向传播:
损失函数:
逻辑斯蒂回归的反向求导:
-