pandas groupby count_Pandas数据聚合

点击蓝字关注我们01导语继2-3期完成了数据探索,了解数据分布后,我们紧接着可以通过数据聚合来对数据进一步的组合分析以获得有价值的信息点。话不多说,接着开始练习吧。02数据聚合-groupbyGroupby在SQL中经常用到,在Excel里是多种函数体现,比如求和是sum,计数是count。pandas的groupby和SQL的类似。需要明确以什么维度聚合,以及聚合的方式是sum求和,抑...
摘要由CSDN通过智能技术生成

点击蓝字

关注我们

01

导语

继2-3期完成了数据探索,了解数据分布后,我们紧接着可以通过数据聚合来对数据进一步的组合分析以获得有价值的信息点。

话不多说,接着开始练习吧。

02

数据聚合-groupby

Groupby在SQL中经常用到,在Excel里是多种函数体现,比如求和是sum,计数是count。

pandas的groupby和SQL的类似。需要明确以什么维度聚合,以及聚合的方式是sum求和,抑或max求最值,还是count计数。

我们下面仍然用spotify的数据来展示应用。

03

哪位艺术家入榜歌曲最多

0 Advanced issue found▲0 Advanced issue found▲

了解到基础数据的内容后(忘记数据集样子的小伙伴可以通过上方专辑查看前几期内容噢~),我们如果想获取哪位艺术家的入榜歌曲最多,只需要对原始数据集按照艺术家名字聚合,而聚合数据为歌曲名去重计数。

所以计算方式如下:

59018f624514113d4b6947708dde25b9.png

pandas的groupby语法为&#x

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值