相关分析总结

 

 在数据分析的过程中,我们常常需要分析两个或两个以上现象之间的因果关系,一般来说,常考虑下面的几种分析方法:

相关分析:不需要区分自变量和因变量,两个或者多个变量之间是平等的关系。通过相关分析可以了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。

回归分析:区分自变量和因变量,适合于因变量和自变量均为连续变量的情况,建立回归方程,要找出因变量和自变量之间的具体的相关关系。如“收入”和“产品销售量”的回归关系。

方差分析:适用于因变量为连续性变量、 自变量为分类变量的情况,如“收入”对“用户满意度”的影响。

本小结着重总结相关分析。

相关类型:

1直线相关:两变量呈线性共同增大,或一增一减,要求两个变量服从联合的正态分布,若不服从,则要考虑变量变换,或者采用等级相关来分析。

2曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。

相关的方向

依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。

1、正相关:一种变量增加或减少,另一种变量也在增加或减少,两种变量变动的方向相同,谓之正相关。

2、负相关:一种变量增加或减少,另一种变量也在减少或增加,两种变量变动的方向相反,谓之负相关。

3、无相关:在两种变量之间,一种变量变动时,另一种变量毫无变动,即使变动也无一定的规律,如人的相貌与人的思想品德,人的身体高矮与学习成绩的好坏等是无什么关系的,这两种变量的关系谓之无相关或零相关。

相关分析针对的数据类型以及计算相关程度的统计量:

1、两个连续性变量:

两个连续变量间呈线性相关时,且两变量服从联合正态分布,使用Pearson积差相关系数。若不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述。

Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Spearman相关系数的计算公式可以完全套用pearson相关系数计算公式,但公式中的xy用相应的秩次代替即可。

2 两个有序分类变量:

Kendall'stau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;

取值范围在-1-1之间,此检验适合于正方形表格;

其他:偏相关分析

适用于在控制其他变量影响的情况下对两个变量进行相关分析,被分析的两个变量必须服从正态分布。比如说,一般情况下,体重和身高呈正相关,如果还要考虑胸围,则在胸围固定的情况下(取胸围的平均值,假设获奖所有个体的胸围都校正为相同的情况下)再求体重和升高的相关(偏相关),则偏相关呈负值。

 

from:http://www.360doc.com/content/070111/15/11966_326615.html

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值