11、pandas：value_counts() 统计函数详细介绍

lghpy01

已于 2022-04-21 16:38:39 修改

阅读量3.7k

点赞数 2

分类专栏： Python数据分析文章标签： python 数据分析数据挖掘

于 2022-01-27 15:46:28 首次发布

本文链接：https://blog.csdn.net/m0_46128639/article/details/122718688

版权

Python数据分析专栏收录该内容

24 篇文章 11 订阅

订阅专栏

value_counts() 统计某列值出现的次数

1.1 基本语法

DataFrame.value_counts(subset=None,
                       normalize=False,
                       sort=True,
                       ascending=False,
                       dropna=True)

参数为：

subset: 表示根据某字段或者某列来进行统计分析

normalize: 返回的是比例而不是频次

ascending: 降序还是升序来排  False是降序，True是升序

sort:  排序  False是升序，True是降序

1.2 常用示例

(1)#统计age列各个年龄的数量
data.value_counts(subset=['age']) 
data['age'].value_counts()  
 
(2)#以百分比计数显示结果，normalize 为False是频次，True是比例
data.value_counts(subset=['age'],normalize=True)  

(3)#ascending 为False是降序，True是升序
data.value_counts(subset=['loanterm'],normalize=False,ascending=True)

(4)#sort: False是升序，True是降序
data.value_counts(subset=['loanterm'],normalize=False,sort=True)

(5)#分组（分箱）统计，类似cut()方法，
 data['age'].value_counts(bins=10) #bins 分成10组统计 
 
(6)#自定义分组的上限与下限
data['age'].value_counts(bins=[10,20,30,40,50,60]) #bins 分成10组统计 

（7）#默认情况下，结果中会忽略包含任何 NA 值的行。有一个参数 dropna 来配置它。我们可以将该值设置为 False 以包含 NA 的行数
df['age'].value_counts(dropna=False)

（8）#统计后根据列排序，可以通过在 value_counts() 之后调用 sort_index(ascending=True) 来完成，
df['age'].value_counts(dropna=False).sort_index(ascending=True)#根据age大小排序

lghpy01

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
11、pandas：value_counts() 统计函数详细介绍

1、value_counts() 统计数值value_counts() 某列值出现的次数1.1 基本语法DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)参数为：subset:
复制链接

扫一扫