dataframe
中有corr()
和corrwith()
两个函数可以计算两成对样本间的相关系数。
corr()
计算dataframe中任意两列之间的相关系数,所以计算量比较大。
import pandas as pd
df = pd.DataFrame({'a':[1,2,3,4,5,6], 'b':[6,5,4,3,2,1]})
df.corr()
结果为:
a b
a 1.0 -1.0
b -1.0 1.0
corrwith()
计算dataframe每列与指定对象之间的相关系数,返回Series。计算量相对较小。
b = pd.DataFrame({'c':[1,2,3,4,5,6]})
df.corrwith(b.c)
结果为:
a 1.0
b -1.0