数据的分组

最新推荐文章于 2024-07-29 09:30:00 发布

Qi_Xi_Miao

最新推荐文章于 2024-07-29 09:30:00 发布

阅读量447

点赞数 1

分类专栏： python数据分析

本文链接：https://blog.csdn.net/Xi_You_Zi/article/details/115678529

版权

这篇博客介绍了Pandas库中数据的分组操作，包括单列分组、多列分组以及如何遍历和统计分组后的数据，强调了分组在数据切片、切块和摘要中的应用。

摘要由CSDN通过智能技术生成

数据的分组

Pandas提供了一个灵活高效的groupby功能，它能对数据集进行切片、切块、摘要等操作。

DataFrame.groupby('列索引'), 分组后的结果为DataFrameGroupBy object，是一个分组后的对象。用groupby的size()方法可以查看分组后每组的数量，并返回一个含有各分组所包含数值数量的Series：print(groups.size())

import pandas as pd
import random
dic = {
   'name':['xiaoming','xiaohua','xiaohong','xiaohei','xiaobai'],'gender':['F','M','F','F','M'],'grade':random.sample(range(0,100),5)}
df = pd.DataFrame(dic)
df

	name	gender	grade
0	xiaoming	F	72
1	xiaohua	M	39
2	xiaohong	F	31
3	xiaohei	F	6
4	xiaobai	M	81

groups = df.groupby('gender')
print(groups)
print(type(groups)) # 分组后的对象

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x00000272FF801DD8>
<class 'pandas.core.groupby.generic.DataFrameGroupBy'>

datas = groups.size()
print(datas) # 返回各组多少数量的Series对象
print(type(datas))

gender
F    3
M    2
dtype: int64
<class 'pandas.core.series.Series'>

# 计算男女比例
rate = datas['F']/datas['M']
rate

1.5

# 计算男女占总人数的比例
for gender, quantity in datas.items():
    rate1 = quantity / df.shape[0]
    final_rate = '%.2f%%'%(rate1*100)
    print('总人数中{}性占比为{}'.format(gender,final_rate))

总人数中F性占比为60.00%
总人数中M性占比为40.00%

最低0.47元/天解锁文章

Qi_Xi_Miao

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录