这节课主要讲的是用大量的数据拟合成一条线,代表了一个变量与另一个变量的线性关系
y=ax+b
数据的方差r区间为(-1,1)表示了相关性的正负和大小,也有R^2属于(0,1)只代表了相关性的强弱
这里其实就是逻辑回归里面的线性回归算法。
这节课的另一个重点其实是相关性和因果性的关系
相关性不代表因果性
两个事物a和b之间有相关性有四种情况
1.因为a,所以b
2.因为b,所以a
3.因为另一件事c,所以a和b,c增大a和b也增大,数据上显示a增大b增大,就认为a,b有相关性
这种相关性也叫做伪相关性
4.纯纯巧合
因此,相关性不能代表因果性
在寻找拟合直线的时候,不只有r和R^2,也要关注散点图,有时散点图的信息也很重要