- 算法运算 加减乘除对应位置运算
- 比较运算 >/</!=
- 汇总运算
count非空值计数
df.count() 默认按每列进行计数 df.count(axis=1) 指定按行进行计数 df['C1'].count() 对某一列进行计数
sum求和
df.sum() 默认按每列进行求和 df.sum(axis=1) 指定按行进行求和 df['C1'].sum() 对某一列进行求和
mean求均值
df.mean() 默认按每列进行求均值 df.mean(axis=1) 指定按行进行求和 df['C1'].mean() 对某一列进行求均值
min求小值 max求最大值 median求中位数 model求众数 var求方差 std求标准差 用法均同上
quantile求分位数
df.quantile(0.25, axis=1) 求取每行四分之一位数 df['c1'].quantile(0.75) 求c1列四分之三位数
相关性运算
corr()函数
df['col1'].corr(df['col2']) #求取col1列与col2列的相关系数
df.corr() #求取各字段两两间的相关性