机器学习——线性回归算法

最新推荐文章于 2024-05-09 22:21:22 发布

风继续吹x

最新推荐文章于 2024-05-09 22:21:22 发布

阅读量381

点赞数 1

文章标签：机器学习算法人工智能 python

本文链接：https://blog.csdn.net/Eos666/article/details/118607217

版权

机器学习——线性回归算法

前言
一、线性回归是什么？
二、数学推导
总结

前言

最近准备开始学习机器学习，后续将对学习内容进行记录，该文主要针对线性回归中涉及得数学公式推导以及算法的理解进行记录！

一、线性回归是什么？

线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记。

二、数学推导

1.问题引入

银行贷款会根据需要贷款人的工资和年龄进行额度的确定，这里给定5个数据样本如下图
在这里插入图片描述
那么我们最终拟合所得线性模型应为 f(x)=w1x1+w2x2+b,
其中w1可以理解工资这个特征对于最终额度的影响，w2可以理解年龄这个特诊对于最终额度的影响，b可以理解为偏置项（即实际额度可能有小额的偏差）

2.数学推导

对于参数给出相关定义
在这里插入图片描述
其中 $\theta_0$ 为偏置系数，与数据无关，影响较小； $\theta_1$ 与 $\theta_2$ 为权重系数，与数据有关，影响较大。
$h_\theta(x)=\sum_{i=0}^n\theta_ix_i=\theta_0x_0+\theta_1x_1+\theta_2x_2$
那么 $x_0$ 如何理解呢？可以为每一个样本引入一个新特征 $x_0$ ，每个样本满足该特征 $x_0=1$ ，
这样就可以将拟合的平面函数转化成矩阵操作
$h_\theta(x)=\sum_{i=0}^n\theta_ix_i=\theta_0x_0+\theta_1x_1+\theta_2x_2=\mathbb{\theta^Tx}$

3.误差说明

在这里插入图片描述

1.为什么误差服从高斯分布？
       可通过中心极限定理的另一种解释得到。受多种独立因素影响的随机变量，是服从正态分布的。而误差都是有多种独立（无相互影响）的误差源，因此，误差近似为正态分布。
2.如何理解独立？
       样本与样本之间无关，算法同等对待每个样本
3.如何理解同分布？
       每一个样本使用的算法确定且一致

3.推导

在这里插入图片描述
1.假设 $\epsilon$ ~ $N(0,\sigma^2)$ 可得式（2）
2.将（1）代入（2）后得到的式子可理解为真实存在的 $y$ 在不同 $\theta$ 取值下，出现的概率

3.极大似然函数就是去找到参数估计值，使得前面已经实现的样本值发生概率最大。因为你手头上的样本已经实现了，其发生概率最大才符合逻辑。（利用已知的样本结果，反推最有可能导致这样结果的参数值）
4.这时是求样本所有观测的联合概率最大化（每个真实存在的 $y$ 在不同 $\theta$ 取值下，出现概率最大），是个连乘积，只要取对数，就变成了线性加总。此时通过对参数求导数，并令一阶导数为零，就可以通过解方程（组），得到最大似然估计值。
在这里插入图片描述
5.通过化简后可知当 $J(\theta)$ 函数最小时，似然函数取极大

6.目标函数转化为矩阵的操作，读者可根据矩阵具体的行列进行推导
假设一共有5个样本，3个特征，那么 $X$ 为53矩阵， $\theta$ 为31矩阵， $y$ 为5*1矩阵，可根据矩阵维度帮助理解目标函数转为矩阵操作
7.所用到矩阵求导公式：
$\frac{dy}{dx}=\frac{d(X^TAX)}{dX}=2AX$
$\frac{dy}{dx}=\frac{d(AX)}{dX}=A^T$
$\frac{dy}{dx}=\frac{d(XA)}{dX}=A$
在这里插入图片描述
$R^2$ 越接近1，模型效果越棒

总结

未完待续！

风继续吹x

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
机器学习——线性回归算法

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码
复制链接

扫一扫