监督学习(1)|一文搞懂线性回归，lasso回归，岭回归

最新推荐文章于 2022-11-28 13:14:27 发布

ZZ邀你聊数科

最新推荐文章于 2022-11-28 13:14:27 发布

阅读量457

点赞数

分类专栏：数据科学-机器学习文章标签：机器学习数据分析

本文链接：https://blog.csdn.net/qq_31242881/article/details/110709077

版权

本文深入介绍了监督学习中的线性回归，包括其简洁的本质、最优思想，以及如何通过最小二乘法求解参数。此外，文章探讨了模型验证的假设检验和拟合优度，并引出了L1（Lasso）和L2（岭回归）正则化在防止过拟合中的作用，以增强模型的泛化能力。

摘要由CSDN通过智能技术生成

1.引言

机器学习三大主要分支：监督学习、无监督学习和半监督学习。
对于监督学习，根据目标数据类型的不同分为二大核心任务：分类和回归。
其中分类指目标数据为离散型变量，回归指目标数据为连续型变量。
对于回归分析方法，本文主要介绍在实际应用最广泛的线性回归分析。之后也会分享对应的实践案例(Python和R)。

2. 简洁的本质

借用“科普中国”科学百科词条中的定义：

回归分析是确定两种或两种以上变量关系的一种统计分析方法。

所谓透过现象看本质，我们希望对观察到的现象，经过统计分析，可以洞悉现象背后客观存在的映射关系。
那么线性回归就是这样一回事：既然回归的目标是得到映射关系，而且牛顿说过真理永远是最简洁的（也许说过，不敢保证），所以我们就假设这种映射关系是简单的，即是线性的，那么就得到了线性回归分析的一般形式。
下面将这段思路转为了符号表示：
对于回归问题，我们希望得到自变量 $x_{1},x_{2},...,x_{m}$ 与因变量 $y$ 的映射关系:
$y=f(x_{1},x_{2},...,x_{m})$
对于线性回归问题，假设映射关系为线性的，即
$y=\beta_{0}+ \beta_{1}x_{1}+\beta_{2}x_{2}+...+\beta_{m}x_{m}$
对于 n 次观测值，可以将映射关系表示成矩阵形式：
$Y=X\beta\tag{1}$
$Y=[y_{1},y_{2},...,y_{n}]^{T},\beta=[\beta_{0},\beta_{1},...,\beta_{m}]^{T} \\ X= \begin{bmatrix} 1 &x_{11} &... &x_{1m}\\ 1 &x_{21} &... &x_{2m}\\ \vdots &\vdots &... &\vdots\\ 1 &x_{n1} &... &x_{nm}\\ \end{bmatrix}$

最低0.47元/天解锁文章

ZZ邀你聊数科

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
监督学习(1)|一文搞懂线性回归，lasso回归，岭回归

1.引言机器学习三大主要分支：监督学习、无监督学习和半监督学习。对于监督学习，根据目标数据类型的不同分为二大核心任务：分类和回归。其中分类指目标数据为离散型变量，回归指目标数据为连续型变量。对于回归分析方法，本文主要介绍在实际应用最广泛的线性回归分析。之后也会分享对应的实践案例(Python和R)。2. 简洁的本质借用“科普中国”科学百科词条中的定义：回归分析是确定两种或两种以上变量关系的一种统计分析方法。所谓透过现象看本质，我们希望对观察到的现象，经过统计分析，可以洞悉现象背后客观存在
复制链接

扫一扫