一、相关性和协方差
pct_change函数
语法:df.pct_change()
功能:表示当前元素与先前元素的相差百分比,即“(当前元素-先前元素)/ 先前元素”
corr函数
语法:df.corr() #返回整个数据表的相关系数矩阵
df.column01.corr(df.column02)或df[‘column01’].corr(df['column02]) #返回两列数值的相关系数
功能:求解相关系数,有pearson、spearman、kendall,pointbiserialr等多个系数,默认采用peason系数。
cov函数
语法:df.cov() #返回整个数据表的协方差矩阵
df.column01.cov(df.column02)或df[‘column01’].cov(df['column02]) #返回两列数值的协方差
功能:求解协方差
corrwith函数
语法:df.corrwith(df.column01) #返回column01列与df所有列的相关系数
df.corrwith(df1) #如果两者均为二维矩阵,会寻找对应的列进行求解相关系数

这篇博客主要介绍了pandas DataFrame在计算相关性和协方差方面的功能,包括pct_change函数、corr函数、cov函数和corrwith函数。此外,还详细讲解了唯一值、计数和成员属性的操作,如unique函数、value_counts函数、isin函数以及pd.Index.get_indexer函数的应用。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



