【LR线性回归算法+梯度下降算法】机器学习公式推导计算+详细过程（入门必备）

最新推荐文章于 2024-07-23 16:09:31 发布

CV_William

最新推荐文章于 2024-07-23 16:09:31 发布

阅读量836

点赞数

分类专栏：机器学习人工智能文章标签：算法机器学习 python 深度学习

本文链接：https://blog.csdn.net/weixin_41194171/article/details/107142827

版权

机器学习同时被 2 个专栏收录

13 篇文章 2 订阅

订阅专栏

人工智能

13 篇文章 0 订阅

订阅专栏

线性回归算法

寻找一条直线，最大程度的”拟合“样本特征和样本标签的关系。

公式

$h_\theta(x) = \theta_0x_0 + \theta_1x_1 + \theta_2x_2 + ... + \theta_nx_n$

上式为基本形式。

$h_\theta(x) = \theta^Tx$
上式为向量形式。

损失函数
$J(\theta) = \frac{1}{2m} \sum_{i=0} ^ m (h_{\theta} (x ^ {i}) - y ^ {i}) ^ 2$
其中：
$y^{(i)} = \theta_0x^{i}_0 + \theta_1x^{i}_1 + \theta_2x^{i}_2 + ... + \theta_nx^{i}_n$

对损失函数求导

对 $\theta$ 求偏导
$\frac{\partial J (\theta)}{\partial \theta} = 2\sum_{i=1} ^ m (y^{i} - \theta x^{i} - \theta_0) * (-x^{i})$
对 $\theta_0$ 求偏导
$\frac{\partial J (\theta)}{\partial \theta_0} = 2\sum_{i=1} ^ m (y^{i} - \theta x^{i} - \theta_0) * (-1)$

梯度下降公式
$\theta_j := \theta_j - \alpha \frac{\partial}{\partial \theta_j} J (\theta)$

$\frac{\partial }{\partial \theta_j} J (\theta) = \alpha \frac{\partial }{\partial \theta_j}\frac{1}{2m} \sum_{i=0} ^ m {(h_\theta(x^{i}) - y^{i})}^2$

$\alpha \frac{1}{m} \sum_{i=0} ^ m {(h_\theta(x^{i}) - y^{i})} * x^{i}$

式中 $\alpha$ 表示学习率

梯度下降公式推导
$\theta_j := \theta_j - \alpha \frac{\partial}{\partial \theta_j} J (\theta)$

$\frac{\partial }{\partial \theta_j} J (\theta) = \frac{\partial }{\partial \theta_j}\frac{1}{2m} \sum_{i=0} ^ m {(h_\theta(x^{i}) - y^{i})}^2$

$\frac{1}{2m} \sum_{i=0} ^ m (\frac{\partial }{\partial \theta_j} (h_\theta(x^{i}) - y^{i})^2)$

连式法则：

$z = f (y)$

$y = g (x)$

$z = f (g (x))$

对 $ z $求导
$(z)^{'} = (f (g (x)))^{'} * (g (x))^{'}$

$\frac{1}{2m} \sum_{i=0} ^ m (\frac{\partial }{\partial \theta_j} (h_\theta(x^{i}) - y^{i})^2)* (\frac{\partial }{\partial \theta_j}(h_\theta(x^{i}) - y^{i}))$

求幂导

$\frac{1}{2m} \sum_{i=0} ^ m 2 * ((h_\theta(x^{i}) - y^{i})) * (\frac{\partial }{\partial \theta_i}(\sum_{i=0} ^ n \theta_i x_i - y^{i}))$

$\frac{1}{m} \sum_{i=0} ^ m ((h_\theta(x^{i}) - y^{i})) * (\sum_{i=0} ^ n (\frac{\partial }{\partial \theta_i} \theta_i x^{i} - \frac{\partial }{\partial \theta_i}y_i)$