11、pandas:value_counts() 统计函数详细介绍

value_counts() 统计某列值出现的次数

1.1 基本语法
DataFrame.value_counts(subset=None,
                       normalize=False,
                       sort=True,
                       ascending=False,
                       dropna=True)
参数为:

subset: 表示根据某字段或者某列来进行统计分析

normalize: 返回的是比例而不是频次

ascending: 降序还是升序来排  False是降序,True是升序

sort:  排序  False是升序,True是降序
1.2 常用示例
(1)#统计age列各个年龄的数量
data.value_counts(subset=['age']) 
data['age'].value_counts()  
 
(2)#以百分比计数显示结果,normalize 为False是频次,True是比例
data.value_counts(subset=['age'],normalize=True)  

(3)#ascending 为False是降序,True是升序
data.value_counts(subset=['loanterm'],normalize=False,ascending=True)

(4)#sort: False是升序,True是降序
data.value_counts(subset=['loanterm'],normalize=False,sort=True)

(5)#分组(分箱)统计,类似cut()方法,
 data['age'].value_counts(bins=10) #bins 分成10组统计 
 
(6)#自定义分组的上限与下限
data['age'].value_counts(bins=[10,20,30,40,50,60]) #bins 分成10组统计 7#默认情况下,结果中会忽略包含任何 NA 值的行。有一个参数 dropna 来配置它。我们可以将该值设置为 False 以包含 NA 的行数
df['age'].value_counts(dropna=False)8#统计后根据列排序,可以通过在 value_counts() 之后调用 sort_index(ascending=True) 来完成,
df['age'].value_counts(dropna=False).sort_index(ascending=True)#根据age大小排序

  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值