pandas中的基本统计应用

pandas中进行统计计算的函数

df.count() #非空元素计算
df.min() #最小值
df.max() #最大值
df.idxmin() #最小值的位置,类似于R中的which.min函数
df.idxmax() #最大值的位置,类似于R中的which.max函数
df.quantile(0.1) #10%分位数
df.sum() #求和
df.mean() #均值
df.median() #中位数
df.mode() #众数
df.var() #方差
df.std() #标准差
df.mad() #平均绝对偏差
df.skew() #偏度
df.kurt() #峰度
df.describe() #一次性输出多个描述性统计指标
df.cov() #计算协方差矩阵
df.corr() #计算相关系数矩阵

排序

df.sort_values(by=[‘var1’,‘var2’], ascending=False) #根据var1、var2降序排序

联接

df3= pd.merge(df1, df2, on=‘var1’) #根据var1进行内联接
df3= pd.merge(df1, df2, on=‘var1’,how=‘left’)#依据var1进行左联接
df_merged=df1.merge(df2,left_on=‘df1_id’,right_on=‘df2_id’)#制定变量名进行联接
df_new=pd.concat([df_p1,df_p2],axis=0)#纵向联接
df_new=pd.concat([df_p1,df_p2],axis=1,ignore_index=True)#横向拼接

对样本进行抽样

df = df.sample(frac=0.3)#抽取30%的样本

可以参考:
https://blog.csdn.net/A632189007/article/details/76176985

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值