机器学习-线性回归原理

最新推荐文章于 2024-07-02 13:08:57 发布

转行的炼丹师

最新推荐文章于 2024-07-02 13:08:57 发布

阅读量180

点赞数

分类专栏：机器学习文章标签：机器学习线性代数

本文链接：https://blog.csdn.net/jose_M/article/details/105858378

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文主要介绍用梯度下降求线性回归最优解的数学细节

线性回归

令 $\left[\begin{matrix} y_1 \\ y_2 \\ \vdots \\y_m \end{matrix}\right]$ ， $\left[\begin{matrix}x_1&1\\x_2&1\\ \vdots \\ x_m &1 \end{matrix}\right]$ ， $w=\left[\begin{matrix}w_1\\w_2\\\vdots\\w_n\\b\end{matrix}\right]$ ， $x_i\in R^n$ ，
$\hat Y = Xw$

objective function:

$J(w)=\frac{1}{2m}(Y-\hat Y)^T(Y-\hat Y)$

gradient of objective function:

根据标量对向量求导公式：

$(\frac{\partial u^Tv}{\partial x}=\frac{\partial u}{\partial x}v+\frac{\partial v}{\partial x}u)$

$\frac{\partial J(w)}{\partial w}=\frac{1}{2m}[\frac{\partial (Y-Xw)}{\partial w}(Y-Xw)+\frac{\partial (Y-Xw)^T}{\partial w}(Y-Xw)^T]=-\frac{1}{m}X^T(Y-Xw)$

gradient descent:

$w=w-\eta \frac{\partial J(w)}{\partial w}=w+\eta\frac{1}{m}X^T(Y-Xw)$

numpy实现

def compute_square_loss(X, y, theta):

    n_instance, n_feature = X.shape
    loss = 1 / (2*n_instance) * (y - X.dot(theta.T)).dot((y - X.dot(theta.T)).T)

    return loss

def compute_square_loss_gradient(X, y, theta):

    n_instance, n_feature = X.shape
    return -1/n_instance * X.T.dot((y - X.dot(theta.T)).T)

如果考虑加上正则化项，当为Ridge Regression时，
（考虑了加上bias一起正则化）

objective function:

$J(w)=\frac{1}{2m}(Y-\hat Y)^T(Y-\hat Y) + \lambda w^Tw$

gradient of objective function:

$\frac{\partial J(w)}{\partial w}=\frac{1}{2m}[\frac{\partial (Y-Xw)}{\partial w}(Y-Xw)+\frac{\partial (Y-Xw)^T}{\partial w}(Y-Xw)^T] + 2\lambda w=-\frac{1}{m}X^T(Y-Xw)+2\lambda w$

gradient descent:

$w=w-\eta \frac{\partial J(w)}{\partial w}=w+\eta(\frac{1}{m}X^T(Y-Xw)-2\lambda w)$

转行的炼丹师

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-线性回归原理

本文主要介绍用梯度下降求线性回归最优解的数学细节线性回归令Y=[y1y2⋮ym]Y = \left[\begin{matrix} y_1 \\ y_2 \\ \vdots \\y_m \end{matrix}\right]Y=⎣⎢⎢⎢⎡y1y2⋮ym⎦⎥⎥⎥⎤，X=[x11x21⋮xm1]X = \left[\begin{matrix}x_1&1\\x_2&...
复制链接

扫一扫