数据相关性分析

相关性分析主要用来描述变量之间的线性相关程度。

在二元变量的相关性分析过程中,常用的有Pearson相关系数Spearman秩相关系数以及判定系数

Pearson积矩相关系数

Pearson 相关评估两个连续变量之间的线性关系。当一个变量中的变化与另一个变量中的成比例变化相关时,这两个变量具有线性关系。

参考资料

适用条件:

  • 两个变量均应由测量得到的连续变量
  • 两个变量所来自的总体都应该是正态分布,或接近正态的单峰对称分布。
  • 变量必须是成对的数据。
  • 两变量间为线性关系。

注意事项:

  • 线性相关的前提条件是X、Y都是服从正态分布的。正态分布
  • 当散点图有线性趋势时,才可以进行线性相关分析。
  • 必须在假设检验认为相关的前提下才能以r的大小判断相关程度(显著性水平)。
  • 相关关系并不一定是因果关系,有可能是伴随关系。

判断步骤:

  1. 找出两个变量的正确相应数据。
  2. 画出散点图,通过散点图判断相关性。
  3. 散点图有线性趋势时,计算相关系数
  4. 对结果进行评价和检验

相关系数的取值:-1 < r < 1,大于0且越接近于1,则表示越是正相关;反转,小于0且越接近于-1则表示越是负相关。

等于0则认为零相关。

 

Spearman秩相关系数

是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。

对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可

Spearman 相关评估两个连续或顺序变量之间的单调关系。在单调关系中,变量倾向于同时变化,但不一定以恒定的速率变化。Spearman 相关系数基于每个变量的秩值(而非原始数据)。

 

判定系数

判定系数是相关系数的平方。

 

计算积距Pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。

研究表明,在正态分布的假设下,Pearson和Spearman在效率上是等价的,而对于连续测量数据,更适合Pearson相关系数来进行分析。在实际应用中,上述两种相关系数都需要对其进行假设检验,使用t检验方法检验其显著性水平以及确定其相关程度。

最好始终用散点图来检查变量之间的关系。相关系数仅度量线性 (Pearson) 或单调 (Spearman) 关系。也有可能存在其他关系。

推荐先观察散点图

 

 

 

 

 

 

 

 

 

 

 

 

  • 2
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
matlab栅格数据相关性分析是通过计算和研究栅格数据之间的相关性来揭示它们之间的关系和影响。在matlab中,可以使用各种统计工具和函数来进行相关性分析,比如相关系数、协方差、以及基于相关性的图表和图形展示。 首先,可以使用相关系数来衡量两个栅格数据之间的线性关系。相关系数可以帮助我们了解一个栅格数据如何随着另一个栅格数据的变化而变化,以及它们之间的强度和方向。相关系数值范围在-1到1之间,越接近1表示正相关,越接近-1表示负相关,接近0表示无相关性。通过计算相关系数,可以快速了解到栅格数据之间的关系。 此外,还可以通过计算协方差来衡量两个栅格数据的总体变化趋势。协方差可以告诉我们两个栅格数据的变化方向是否一致,以及它们之间的关联程度。在matlab中,可以使用cov函数来计算两个栅格数据的协方差。 最后,可以使用基于相关性的图表和图形展示来更直观地展现栅格数据之间的关系。比如可以绘制散点图来观察两个栅格数据之间的分布情况,或者使用相关性矩阵来展示多个栅格数据之间的相关性。这些图表和图形可以帮助我们更直观地理解和分析栅格数据之间的关系。 总之,matlab栅格数据相关性分析是一个重要的数据分析工具,可以帮助我们深入了解栅格数据之间的关系,从而为进一步的数据处理和决策提供有力的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值