python之value_counts()介绍

目录


value_counts() 是一个用于统计某列中各个值的出现次数的函数。当配合参数 bins 使用时,它可以将数据分成指定的区间,然后统计每个区间内值的出现次数。

举个例子,假设我们有一个包含身高数据的DataFrame:

|   姓名  | 身高(cm) |
|--------|---------|
|   小明 |   175   |
|   小红 |   160   |
|   小刚 |   180   |
|   小美 |   162   |
|   小强 |   175   |
|   ...  |   ...   |

我们可以使用 value_counts() 统计各个身高出现的次数:

height_counts = df['身高(cm)'].value_counts()

结果可能如下:

180    3
175    2
162    1
160    1
Name: 身高(cm), dtype: int64

这表示在数据中,身高为180cm的出现了3次,175cm出现了2次,162cm出现了1次,160cm出现了1次。

如果我们想将身高分成几个区间并统计每个区间内的人数,可以使用 bins 参数:

height_counts_bins = df['身高(cm)'].value_counts(bins=[150, 160, 170, 180, 190])

这将把身高分成以下区间:(150, 160], (160, 170], (170, 180], (180, 190],然后统计每个区间内的人数。

输出

假设在给定的数据中:

  • 有3个人的身高在区间 (150, 160] 内,
  • 有2个人的身高在区间 (160, 170] 内,
  • 有1个人的身高在区间 (170, 180] 内,
  • 没有人的身高在区间 (180, 190] 内,

那么 height_counts_bins 的输出可能会是类似于以下的结果:

(150.0, 160.0]    3
(160.0, 170.0]    2
(170.0, 180.0]    1
(180.0, 190.0]    0
Name: 身高(cm), dtype: int64

希望这个例子能帮到您理解 value_counts()bins 的用法。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值