数据分析学习总结笔记07:回归分析概述
1 什么是回归分析
1.1 回归分析概述
回归是用一条有代表性的直线或曲线(在高维空间中,则为超平面或一般曲面)来拟合输入输出数据的一种方法。
拟合的直线或函数刻画了变量之间的相互联系,基于这种联系我们可以对新获得的输入数据的输出结果进行预测。
回归分析:主要研究变量间的统计联系,通过建立统计模型研究变量间相互关系的密切程度、结构状态及进行预测。
1.2 “回归”的由来
- 回归的古典意义:
- 高尔顿(Galton)遗传学的回归概念。
- 父母身高与子女身高的关系:无论高个子或低个子的子女都有向人的平均身高回归的趋势。
- 高尔登把这种孩子的身高向平均值靠近的趋势称为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。
- 回归的现代意义:
- 一个因变量对若干解释变量依存关系的研究,用恰当的数学模型近似地表达或估计变量之间的变化关系。
- 实质:由已知的或固定的自变量的数值,去估计因变量的总体平均值。