线性回归
一、 相关系数
数字与数字之间的关系-----分析工作
数字关系只要有两种
函数关系:确定关系 y=ax+b
相关关系:非确定关系
我们一般使用相关系数去描述两个数组件的线性相关程度;
相关系数一般为r=
简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。
定义式 [1]
r(x,y) = cov( x,y) / [(D(X)D(y))^0.5]
协方差= ∑(x-x均)(y-y均)
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差
复相关系数:
又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。
例如,某种商品的季节性需求量与其价格水平、职工收入水平等现
象之间呈现复相关关系。
典型相关系数:
是先对原来各组变量进行主成分分析,得到新的线性关系的综合指
标,再通过综合指标之间的线性相关系数来研究原各组变量间相
关关系。
1、 成对的(x,y)数据为一对随机变量;
2、 r只能用来度量线性关系
3、 -1≤r≤1 (r=1时确定的相关关系)
4、 离群值会影响r,需要剔除
5、 相关关系不是因果