python-使用.corr获取两列之间的相关性
我有以下熊猫数据框Top15:
我创建一列来估算每人可引用文件的数量:
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
我想知道人均引用文件数量与人均能源供应之间的相关性。 因此,我使用.corr()方法(皮尔森相关性):
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
我想返回一个数字,但是结果是:
7个解决方案
135 votes
没有实际数据,很难回答这个问题,但是我想您正在寻找这样的东西:
Top15['Citable docs per Capita'].corr(Top15['Energy Supply per Capita'])
这将计算两个列NaN和1s之间的相关性。
举个例子:
import pandas