1.线性回归中的相关度和决定系数
协方差反映的是两个随机变量间的相关关系。如果同步增大,则协方差为正。
皮尔逊系数就是协方差除以两个随机变量的方差,相关度越高,皮尔逊系数将会趋于1/-1。
R平方叫做决定系数,反应因变量变异程度可以通过回归关系被自变量解释的比例。
局限性:随着自变量增加,R平方一定会增加。
2.最小二乘
3.因果识别
举一个例子来说明:读大学并拿到本科学位对收入有什么影响?
对于某个特定的个人,我们需要知道两件事:1)这个人读大学并拿到本科学位之后的收入;2)让这个人穿越回要上大学之前的那个节点,不上大学,直接去工作的收入。用1&#x