1 准备数据
使用维基中的例子:
例如,假设五个国家的国民生产总值分别是1、2、3、5、8(单位10亿美元),又假设这五个国家的贫困比例分别是11%、12%、13%、15%、18%。
采用如下的命令设置当前的路径:
> setwd("D:/StudyCase/StudyR/correlation")
> getwd()
[1] "D:/StudyCase/StudyR/correlation"
然后在该路径下面建立一个csv文件test.csv,其内容如下:
V1,V2
1,0.11
2,0.12
3,0.13
5,0.15
8,0.18
采用下面的命令将该数据读入到R系统中:
> v=read.csv("test.csv",header=T)
> v
V1 V2
1 1 0.11
2 2 0.12
3 3 0.13
4 5 0.15
5 8 0.18
> v$V1
[1] 1 2 3 5 8
可以看出,R在读入数据时,就像csv文件的原始布局一样,将它们放入到一个dataframe中。其中每个列代表一个变量,采用v$V1访问相应的变量。
2 计算相关系数
R不仅能计算pearson相关系数,还能计算”kendall”和”spearman” 相关系数,通用的语法格式为:
> cor( var1, var2, method = "method")
默认的方法为pearson,当你使用其他的方法时,需指定相应的方法名”kendall”或”spearman”。
于是,计算的pearson相关系数如下:
> cor(v$V1,v$V2)
[1] 1
简单加好玩吧!关于peason相关系数等的含义,请参见相关的资料。