线性回归与正则化

最新推荐文章于 2024-08-14 22:32:50 发布

Marcus_XF

最新推荐文章于 2024-08-14 22:32:50 发布

阅读量8k

点赞数 2

分类专栏：数学模型文章标签：统计学线性回归正则化

本文链接：https://blog.csdn.net/Marcus_XF/article/details/51322051

版权

本文详细介绍了线性回归的概念、一元与多元线性回归、最小二乘法的合理性，以及岭回归和LASSO正则化方法。线性回归在统计学中扮演重要角色，通过最小二乘法找到最佳拟合直线。正则化通过岭回归和LASSO防止过拟合，LASSO还能进行特征选择。在R语言中，可以使用lm()、lm.ridge()和lars()函数进行线性回归分析。

摘要由CSDN通过智能技术生成

线性回归与正则化

线性回归总述

追根溯源，回归(Regression)这一概念最早由英国生物统计学家高尔顿和他的学生皮尔逊在研究父母亲和子女的身高遗传特性时提出。他们的研究揭示了关于身高的一个有趣的遗传特性：若父母个子高，其子代身高高于平均值的概率很大，但一般不会比父母更高。即身高到一定程度后会往平均身高方向发生“回归”。这种效应被称为“趋中回归(Regression Toward the Mean)”。如今，我们做回归分析时所讨论的“回归”和这种趋中效应已经没有任何瓜葛了，它只是指源于高尔顿工作的那样一整套建立变量间数量关系模型的方法和程序，即用一个或多个自变量来预测因变量的数学方法。

回归分析之所以成为一种重要的统计模型，是因为它关注的是现象解释和预测，而不仅是描述层面的统计分析。在一个回归模型中，我们需要关注或预测的变量叫做因变量（响应变量或结果变量），我们选取的用来解释因变量变化的变量叫做自变量（解释变量或预测变量）。做回归分析，确定变量后我们还需要根据具体问题选择一个合适的回归模型，通俗地说就是把自变量映到因变量的函数的大体样子。常用的回归模型有线性回归，多项式回归，逻辑斯蒂回归等等。考虑到线性关系是自然界最普遍，最本质的数量关系，所以毋庸置疑线性回归是最简单实用的一类回归模型，也是其他回归模型研究的基础。本节我们主要讨论线性回归的相关理论及部分应用场景。