评估两个变量的统计相关性,除了Pearson极差相关系数和Spearman相关系数外,很多情况下的相关性需要我们自己定义。
例如 x,y为每小时收集到的气温和气压测量值。我们定义两者的相关性为x和y同时上升或下降次数占总观测数的比例。
x: 5 12 13 3 6 0 1 15 16 8 88
y: 4 2 3 23 6 10 11 12 6 3 2
用R语言实现思路:
上升或下降的趋势表示
每个预测量后项减去前项,如果>0则表示上升,否则认为下降。(ifelse判断)
占比
相同次数/总次数
代码实现
findud<-function(x){
ud<-(x[-1]-x[-length(x)])#构造新向量=向量去头/去尾,做差可以得到上升下降趋势
res<-ifelse(ud>0,1,0)