机器学习算法 - 线性模型（公式推导+代码）

why do not

已于 2022-04-04 12:10:23 修改

阅读量2.5k

点赞数 17

分类专栏：机器学习文章标签：机器学习算法 python

于 2021-07-21 17:02:44 首次发布

本文链接：https://blog.csdn.net/qq_42994177/article/details/118938006

版权

文章目录

一、线性回归
二、逻辑回归

一、线性回归

1.线性回归描述

是一种预测模型，利用各个特征的数值去预测目标值。线性回归的主要思想是给每一个特征分配一个权值，最终的预测结果是每个特征值与权值的乘机之和再加上偏置。所以训练的目标是找到各个特征的最佳权值和偏置，使得误差最小。线性回归的假设前提是噪声符合正态分布。线性回归也可以做分类，但是效果不好。

2.线性回归公式（正规方程求解）

2.1 一元回归公式推导

假设输入属性的数目只有一个
Alt
如何确定 w 和 b ?关键在于如何衡量f(x)与y之间的差别。我们可以让均方误差最小化，使每一个样本的预测值与真实值的差的平方和最小，即
在这里插入图片描述
对 w 和 b 分别求偏导，并令二者的偏导数为零

分别令二者等于0便可以得到 w和 b的最优解：
得出b的值为：

w的值求解过程：

带入b的值

最右的平方项移项到左边可得

得出w的值为

基于均方误差最小化来进行模型求解的方法称为”最小二乘法“。

详情：https://blog.csdn.net/wx_blue_pig/article/details/79779500

2.2 多元回归公式推导

更一般的情况，数据集D中的样本由 d 个属性描述
为便于讨论，我们把 w 和 b 吸收入向量形式 w^=( w; b)，相应的，把数据集D表示为一个m*(d+1)大小的矩阵X（最后一个元素恒置为1）。
最小二乘法运用在一元线性回归上的情形，那么对于多元线性回归来说，我们可以类似得到
在这里插入图片描述

根据向量内积的定义可知，上式可以写成如下向量内积的形式

其中

所以

令 $E_{\hat w}$ = $({\it{y} - X\hat w})^T$ $({\it{y} - X\hat w})$ ，对 $\hat w$ 求导得到
$\bf\frac{\partial E_{\hat w}}{\partial \hat w} = 2 X^T(X\hat w - y)$

此处推导涉及到矩阵运算和求导
[推导]：
将 $E_{\hat w}$ = $({\it{y} - X\hat w})^T$ $({\it{y} - X\hat w})$ 展开可得
$E_{\hat w}=y^Ty-y^TX\hat w-\hat w^TX^Ty+\hat w^TX^TX\hat w$
对 $\hat w$ 求导可得
$\frac{\partial E_{\hat w}}{\partial \hat w}=\frac{\partial y^Ty}{\partial\hat w}-\frac{\partial y^TX\hat w}{\partial\hat w}-\frac{\partial\hat w^TX^Ty}{\partial\hat w}+\frac{\partial\hat w^TX^TX\hat w}{\partial\hat w}$
由矩阵微积分公式 $\frac{\partial a^Tx}{\partial x}=\frac{\partial x^Ta}{\partial x}=a$ ， $\frac{\partial x^TAx}{\partial x}=(A+A^T)x$ 可得
$\frac{\partial E_{\hat w}}{\partial \hat w}=0-X^Ty-X^Ty+(X^TX+X^TX)\hat w$ $\frac{\partial E_{\hat w}}{\partial \hat w}=2X^T(X\hat w-y)$

令上式为零，可得 $\hat w$ 的最优解的闭式解。这里涉及矩阵逆的计算
当 $\bf X^TX$ 为满秩矩阵或正定矩阵时，可得 $\bf\hat w^*=(X^TX)^{-1}X^Ty \quad ，$ 其中 $X^TX)^{-1}$ 是矩阵 $X^TX)$ 的逆矩阵。
令 $\hat x_i=(x_i;1)$ ，则最终学得的多元线性回归模型为 $\bf f(\hat x_i)=\hat w^T\hat x_i=\hat x_i^T(X^TX)^{-1}X^Ty$

3.梯度下降法求解

梯度下降法详情：https://zhuanlan.zhihu.com/p/90462431

3.1 一元线性回归

假设函数： $h_\theta(x)=\theta_0+\theta_1x$

最低0.47元/天解锁文章

why do not

关注

17
点赞
踩
69

收藏

觉得还不错? 一键收藏
13
评论
机器学习算法 - 线性模型（公式推导+代码）

一、线性回归1.线性回归描述是一种预测模型，利用各个特征的数值去预测目标值。线性回归的主要思想是给每一个特征分配一个权值，最终的预测结果是每个特征值与权值的乘机之和再加上偏置。所以训练的目标是找到各个特征的最佳权值和偏置，使得误差最小。线性回归的假设前提是噪声符合正态分布。线性回归也可以做分类，但是效果不好。2.线性回归公式1.一元回归公式推导假设输入属性的数目只有一个如何确定 w 和 b ?关键在于如何衡量f(x)与y之间的差别。我们可以让均方误差最小化，使每一个样本的预测值与真
复制链接

扫一扫

专栏目录