spearman相关性分析(R语言findcorrelation()函数的python平替)

直接放代码

import seaborn as sns
import pandas as pd
# Spearman 相关性分析
corr = data.corr(method='spearman')
print(corr) 

# 绘制相关系数热力图
sns.heatmap(corr, annot=True, cmap="YlGnBu") # 特征很多的话这个图会很丑不建议画

# 剔除相关性系数高于threshold的corr_drop
threshold = 0.9 # 自己设置阈值
upper = corr.where(np.triu(np.ones(corr.shape), k=1).astype(np.bool))
corr_drop = [column for column in upper.columns if any(upper[column].abs() > threshold)] # 返回被剔除变量的列表,后续操作省略

虽然是粗糙平替,但必不可能安装R!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
findCorrelation()函数是carat包中的一个函数,用于计算自变量之间的相关系数矩阵,并找出相关系数绝对值最大的那对自变量。然后,该函数计算每个自变量与其他自变量的相关系数的均值,并选择平均相关系数较大的自变量进行移除。该过程重复进行,直到所有相关系数的绝对值都低于设定的阈值为止。函数的使用示例可以参考以下代码: highCorr <- findCorrelation(cor(sdat), cutoff = 0.75) sdat <- sdat[-highCorr] cor(sdat) 在上述代码中,通过调用findCorrelation()函数计算相关系数矩阵,并将相关系数绝对值高于0.75的自变量移除。然后,通过调用cor()函数计算新的相关系数矩阵。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [R语言之数据预处理(下)](https://blog.csdn.net/lulujiang1996/article/details/78812254)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [caret包函数不完全解析](https://blog.csdn.net/wolfbloodbj/article/details/8831877)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值