pandas查找某个字段下的基本信息value_counts

以一个music表为例,查找音乐类别分别有多少个,占比是多少,有哪几种genre,总共有几种

1.首先查找每中音乐类别的数量

方法一:以一个music的表格为例,values_count()是series的argument

import pandas as pd
music=pd.read_csv('music.csv')
music['music genre'].value_counts()

结果如下
在这里插入图片描述

方法二:用groupby把数据按照gender分类,输出count()

不推荐 没有必要这时候用

import pandas as pd
music=pd.read_csv('music.csv')
music.groupby('music genre')['music genre'].count()

效果一样:
在这里插入图片描述

这里相当与sql中的

select music_genre,count(*from music
group by music_genre

grouppby的正确使用场合:根据genre分类 查找每个分类下的最大年龄

import pandas as pd
music=pd.read_csv('music.csv')
music.groupby('music genre')['age'].max()

输出结果如下:
在这里插入图片描述

2.查找每个genre的占比

import pandas as pd
music=pd.read_csv('music.csv')
music['music genre'].value_counts(normalize=True)

输出结果(结果为float64):在这里插入图片描述

3.查找有哪几种genre

unique()
在这里插入图片描述

4.查找总共有多少genre

nuinque()
在这里插入图片描述

5. crosstab

相每种音乐风格下 各个年龄段的人的个数
相当于透视表的row是genre,col是age

pd.crosstab(music['music genre'],music.age)

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值