pd.DataFrame统计各列数值多少

.count()          #非空元素计算
.min()   a         #最小值
.max()            #最大值
.idxmin()         #最小值的位置,类似于R中的which.min函数
.idxmax()         #最大值的位置,类似于R中的which.max函数
.quantile(0.75)    #75%分位数
.sum()            #求和
.mean()           #均值
.median()         #中位数
.mode()           #众数
.var()            #方差
.std()            #标准差
.mad()            #平均绝对偏差
.skew()           #偏度
.kurt()           #峰度
.describe()       #一次性输出多个描述性统计指标

如果你想统计各个列大于0的元素个数:

data[data>0].count()

会出现各个属性(列)大于零的个数

data[data['A']>0].count()

列A大于0的个数

这里说明,data的数据格式必须是DataFrame

pd.Series().value_counts(),会统计各个类的统计值。

我们在用这些函数时,会迷茫,不知道什么时候value_counts(),什么时候count()

这和前面的数据形式是有关的,只要前面是Series数据,要用value_counts(),前面数据形式是DataFrame要用count()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值