R语言笔记-变量间相关性评价

本文介绍了如何使用R语言评估连续变量间的Pearson、Spearman和Kendall相关系数,以及相关系数的假设检验与置信区间。此外,还探讨了分类变量间相关性的测量,包括独立分类变量的Phi、列联系数和Cramer's V,以及配对列联表的一致性——Kappa统计量。
摘要由CSDN通过智能技术生成


示例数据: MASS包中的 birthwt数据集。
首先将数据集中的分类变量因子化,具体参考 这里

连续变量间相关性

为便于处理,将数据集中的连续变量抽取为一新的数据集:cont.vars<-dplyr::select(birthwt,age,lwt,bwt)

计算Pearson、Spearman、Kendall相关系数:cor(,method="")

计算相关系数矩阵的语法:cor(数据框名,method="相关系数名称")

  • Pearson相关系数:一般要求两个变量服从正态分布
  • Spearman和Kendall相关系数:对变量分布没有要求
> cor(cont.vars,method="pearson")
           age       lwt        bwt
age 1.00000000 0.1800732 0.09031781
lwt 0.18007315 1.0000000 0.18573328
bwt 0.09031781 0.1857333 1.00000000
> cor(cont.vars,method="spearman")
           age       lwt        bwt
age 1.00000000 0.1860614 0.06123376
lwt 0.18606140 1.0
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值