机器学习线性回归

最新推荐文章于 2024-08-18 23:20:49 发布

EdVzAs

最新推荐文章于 2024-08-18 23:20:49 发布

阅读量271

点赞数 1

文章标签：机器学习线性回归局部加权线性回归逻辑回归广义线性回归

本文链接：https://blog.csdn.net/weixin_46131409/article/details/118933036

版权

本文详细介绍了线性回归的各个方面，包括简单线性回归、多元线性回归和局部加权线性回归。讨论了线性回归的优缺点、模型假设以及如何通过最小二乘法和梯度下降求解。此外，还提到了广义线性回归，包括对数线性回归、泊松回归、概率单位回归和多项式回归，并特别讨论了逻辑回归及其在二值数据问题中的应用。

摘要由CSDN通过智能技术生成

一.概述
1.概念:

"线性回归"(Linear Regression)是最简单的回归,目标是找到"自变量"(Independent Variable)与"因变量"(Dependent Variable)/
"响应变量"(Response Variable)之间的线性关系.相应的模型为"线性回归模型"(Linear Regression Model),该模型需要假设因变量服
从正态分布(高斯分布)

2.优缺点
(1)优点:

①思想简单,实现容易,建模迅速
②运算速度快
③是许多强大的非线性模型的基础
④容易理解,可解释性好,利于决策分析

(2)缺点:

①难以很好得拟合关系复杂的数据
②存在多重共线性的问题

二.线性回归
1.简单线性回归
(1)模型:

简单线性回归(Simple Linear Regression)是指找到1个自变量与1个因变量间的线性关系.简单线性回归模型(Simple Linear Regression Model)为 $y=β_0+β_1x+ε\qquad(1)$ 其中 $x, y$ 分别为自变量和因变量; $β_0,β_1$ 为参数; $ε$ 为1个随机变量.而简单线性回归方程(Simple Linear Regression Equation)为 $E(y)=β_0+β_1x\qquad(2)$ 其中 $β_0$ 称为截距(Intercept)或偏置(Bias), $β_1$ 称为权重(Weight),统称回归系数(Regression Coefficient).该方程是通过对 $(1)$ 式两侧同时求期望得到的,对应的图像是1条直线,称为回归线

相应的估计简单线性回归方程(Estimated Simple Linear Regression Equation)为 $\hat{y}=b_0+b_1x\qquad(3)$ 其中 $b_0,b_1$ 为参数, $x$ 为自变量, $\hat{y}$ 为因变量 $y$ 的估计值

$(3)$ 式需要满足 $\min\:{\frac{1}{2}\displaystyle\sum_{i=1}^n(y_i-\hat{y}_i)^2}$ 其中 $x_i,y_i)$ 为所有数据点, $\hat{y}_i$ 为 $(3)$ 式在 $x_i$ 处的值.这是1个最小二乘问题,通过正规方程可解得 $b_1=\frac{\displaystyle\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\displaystyle\sum_{i=1}^n(x_i-\bar{x})^2}\\b_0=\bar{y}-b_1\bar{x}$ 也可使用梯度下降求解

(2)假设:

经典线性回归模型要求满足下述假设:
$①$ 为满足正态分布的独立实随机变量
$② E (ε) = 0$
$③$ 同方差假定(Homoscedasticity Supposition): $D(ε)=σ^2$
$④$ 随机项非自相关假定(Nonautocorrelation Supposition): $Cov(ε_i,ε_j)=0$ ,其中 $ε_i,ε_j$ 是 $x$ 取不同值时的随机项
$⑤$ 高斯-马尔可夫假定(Gauss-Markov Supposition): $C o v (ε, x) = 0$