线性回归的数学推导

最新推荐文章于 2022-09-12 22:22:25 发布

wyh_wen

最新推荐文章于 2022-09-12 22:22:25 发布

阅读量435

点赞数

分类专栏：数学理论基础算法机器学习数据分析文章标签：线性回归公式推导矩阵求导最小二乘基础算法

本文链接：https://blog.csdn.net/qq_42370261/article/details/83409601

版权

机器学习同时被 3 个专栏收录

11 篇文章 1 订阅

订阅专栏

数据分析

10 篇文章 0 订阅

订阅专栏

基础算法

8 篇文章 0 订阅

订阅专栏

线性回归是最基础的算法，同时也是其他高级算法的根基，下面就和大家一起进攻基础算法之线性回归。

线性回归模型是用一条曲线去拟合一个或多个自变量 x 与因变量 y 之间关系的模型，那模型的好坏关键在于真实值与预测值之间的差异。

一般表达式

$\large \dpi{150} \large h_{\theta }\left ( x \right )=\theta _{0}+\theta _{1}x_{1}+\theta _{2}x_{2}+...+\theta _{n}x_{n}$

向量表达式

上面表达式得到的是预测值，而预测值与真实值之间的差异用误差 $\large \varepsilon$ 来表示。于是，每一个样本的真实值与预测值之间存在这样的关系：

其中 $\large y^{\left ( i \right )}$ 是真实值， $\theta ^{T}x^{\left ( i \right )}$ 是预测值， $\large \varepsilon ^{\left ( i \right )}$ 是误差。

误差 $\large \varepsilon ^{\left ( i \right )}$ 是独立同分布的，并且服从均值为0方差为 $\large \sigma ^{2}$ 的高斯分布（也称为正态分布）。补充：正态分布的均值和方差取不同值，得到不同的分布图，但均值为0，方差为1的分布称为标准正态分布。

其中，高斯分布表达式为：

$\large f\left ( x \right )=\frac{1}{\sqrt{2\pi }\sigma }exp^{\frac{-\left ( \varepsilon _{i} -\mu \right )^{2}}{2\sigma ^{2}}}$

由于误差服从均值为0方差为 $\large \sigma ^{2}$ 的高斯分布，所以满足：

于是得到：

该式子表示 $\large \theta$ 和 $\large x^{\left ( i \right )}$ 结合后的值与 $\large y^{\left ( i \right )}$ 接近的概率，即误差 $\large \varepsilon ^{\left ( i \right )}$ 最小的概率，即概率越大，说明预测值与真实值越接近。

由于线性回归模型是一条直线（或超平面）拟合多个点，所以需要满足所有误差取得最小值，即所有概率的乘积最大化，符合似然函数：

上式中需要找到 $\large \theta$ 能使得概率连乘 $\large L\left ( \theta \right )$ 最大化，也就是预测值与真实值无限接近。

由于连乘难解，所以需要转化成加法，取对数得：

上面的式子中，第一项是确定值，而第二项是变动值，所以要使得 $\large logL\left ( \theta \right )$ 最大，即要使得 $\large \dpi{80} \large \sum_{i=1}^{m}\left ( y^{\left ( i \right )} -\theta ^{T}x^{\left ( i \right )}\right )^{2}$ 最小化，于是得到损失函数

求损失函数 $\large J\left ( \theta \right )$ 取得最小值时的 $\large \theta$ ，下面利用矩阵求导来进行求解。

目标函数为：

求偏导：

另偏导数为0，得：

得到的 $\large \theta$ 可以使得预测值尽可能接近真实值。

矩阵求导可参考：https://blog.csdn.net/nomadlx53/article/details/50849941

wyh_wen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线性回归的数学推导

线性回归是最基础的算法，同时也是其他高级算法的根基，下面就和大家一起进攻基础算法之线性回归。线性回归模型是用一条曲线去拟合一个或多个自变量 x 与因变量 y 之间关系的模型，那模型的好坏关键在于真实值与预测值之间的差异。一般表达式向量表达式 ...
复制链接

扫一扫