人工智能01-线性回归模型

最新推荐文章于 2024-09-27 19:00:00 发布

想做PM的Janna

最新推荐文章于 2024-09-27 19:00:00 发布

阅读量692

点赞数 12

分类专栏：人工智能文章标签：线性回归机器学习

本文链接：https://blog.csdn.net/qq_50475642/article/details/136648429

版权

人工智能专栏收录该内容

4 篇文章 0 订阅

订阅专栏

01-线性回归

回归分析

回归分析（Regression Analysis）：根据数据，确定两种或两种以上变量间相互依赖的定量关系。

例如：百万人口医生数量预测区域人均寿命

在这里插入图片描述

函数表达式：
$y=f(x_1,x_2,\cdots,x_n)$

回归主要有以下分类方式：

按变量数分为：
- 一元回归： $y = f (x)$
- 多元回归： $y=f(x_1,x_2,\cdots,x_n)$
按函数关系分为
- 线性回归： $y = a x + b$
- 非线性回归： $y=ax^2+bx+c$

线性回归

线性回归：回归分析中，变量和因变量存在线性关系，属于机器学习中的监督学习

函数表达式：
$y = a x + b$

回归问题求解步骤：例如，判断某 $x$ 值 $\widetilde{x}$ 是否在其对应 $y$ 值 $\widetilde{y}$ 的合理范围内

确定 $x$ 和 $y$ 之间的定量关系
- $y = f (x)$
- 线性模型： $y = a x + b$ ——寻找合理的 $a$ 和 $b$
根据关系预测合理值
- $y_{(x=\widetilde{x})}=f(\widetilde{y})$
做出判断

如何寻找到最合适的 $a$ 、 $b$ ?假设 $y^{'}$ 为模型输出结果， $m$ 为样本数，目标： $y^{\prime}$ 尽可能接近 $y$
$min\{\sum^{m}_{i=1}{ (y_i^{\prime}-y_i)^{2}}\}$
上式意味着 $y_i'$ 与 $y$ 的距离和最小
$min\{\frac{1}{2m}\sum^m_{i=1}(y_i^{\prime}-y_i)^2\}$
在前式的基础上除以 $2 m$ ，可以在求导时将 $2 m$ 约掉，以上算式即为损失函数 J。那么，目标变为：尽可能让 J 变小！

（作为初学者：
看到这里我：就这？？如果在学校这一定是水课！
开始听后面：啊？啊？啊？为什么啊？啊？）

损失函数

$\frac{1}{2m}\sum^m_{i=1}(y_i^{\prime}-y_i)^2=\frac{1}{2m}\sum^m_{i=1}(ax_i+b-y_i)^2=g(a,b)$
通过换元得到以上等式，我们可以将损失函数推导为关于 $a$ , $b$ 的二次函数。那么如何寻找最小值呢？

梯度下降法

通过向函数上当前点对应梯度（或者是近似梯度）的反方向的规定步长距离点进行迭代搜索，直到在极小点收敛。（你在说什么？？？）
$J=f(p)\rightarrow p_{i+1}=p_i-\alpha\frac{\partial}{\partial p_i}f(p_i)$
在这里插入图片描述

来点通俗易懂的：步长是从 $p_i$ 到 $p_{i+1}$ 在x轴上的距离，就是通过求偏导的方式向极小值一步一步靠近。

寻找损失函数极小值

主要分为以下步骤：

设置 $a$ 和 $b$ 的初始值（只要不是小于极小值的数，看起来不无所谓，不过离极小值越远计算次数越多）
计算两个临时值 $temp_a$ 和 $temp_b$ 满足下式：
$temp_a=a-\alpha\frac{\partial}{\partial a}g(a,b)=a-\alpha\frac{1}{m}\sum^m_{i=1}(ax_i+b-y_i)x_i$
$temp_b=b-\alpha\frac{\partial}{\partial b}g(a,b)=b-\alpha\frac{1}{m}\sum^m_{i=1}(ax_i+b-y_i)$
将 $temp_a$ 和 $temp_b$ 作为初始值重复计算，直到两值稳定