一、回归分析的任务就是, 通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进 而达到通过X去预测Y的目的。
常见的回归分析有五类:线性回归、0‐1回归(逻辑回归)、定序回归、计数回归 和生存回归,其划分的依据是因变量Y的类型。
1.因变量还可以有多种类别:
(1)连续数值型变量
(2)0-1型变量:结果只有两种并且相互对立。
(3)定序变量:拥有一定的顺序如:优秀、良好、中等、及格、不及格。
(4)计数变量:代表发生次数。
(5)生存变量:截止数据(不确定),例如:寿命80+,截止到今年他80岁,具体他能够活到多少岁,还不知道。
2.这就是回归分析要完成的三个使命:
第一、识别重要变量;
第二、判断相关性的方向;
第三、要估计权重(回归系数(必须要去量纲))
3.回归分析的分类:
OLS:普通最小二乘
GLS:广义最小二乘
不同数据类型的处理方法:
横截面数据:在某一时点收集的不同对象的数据。
时间序列数据:对同一对象在不同时间连续观察所取得的数据
面板数据:横截面数据与时间序列数据综合起来的一种数据资源。