python两列数据相关性_使用.corr获取两列之间的相关性

如果没有实际数据,很难回答这个问题,但我想您正在寻找这样的东西:Top15['Citable docs per Capita'].corr(Top15['Energy Supply per Capita'])

举个例子:import pandas as pd

df = pd.DataFrame({'A': range(4), 'B': [2*i for i in range(4)]})

A B

0 0 0

1 1 2

2 2 4

3 3 6

那么df['A'].corr(df['B'])

按预期给出1。

现在,如果你改变一个值,例如df.loc[2, 'B'] = 4.5

A B

0 0 0.0

1 1 2.0

2 2 4.5

3 3 6.0

指挥部df['A'].corr(df['B'])

回报0.99586

这仍然接近1。df.corr()

因此会回来A B

A 1.000000 0.995862

B 0.995862 1.000000

在您显示的图形中,仅表示相关矩阵的左上角(我假设)。

在某些情况下,您可以在解决方案中获得NaNs,例如检查this post。

如果要筛选高于/低于某个阈值的条目,可以选中this question。

如果要绘制相关系数的热图,可以选中this answer,如果遇到重叠轴标签的问题,则选中the following post。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值