【小白从小学Python、C、Java】
【Python全国计算机等级考试】
【Python数据分析考试必会题】
● 标题与摘要
Python数据分析中对DataFrame的
数据分组处理groupby
● 选择题
以下关于数据分组处理的说法错误的是:
A 可以通过groupby函数实现分组处理
B groupby函数返回值为一个对象
C groupby函数会改变原数据
D 可以对groupby处理得到的对象进行组内求和计算
● 问题解析
1.数据分析中常常需要按照某个特征对Dataframe类型的数据进行分组处理,并对分组处理后的数据进行相应的计算(如求平均值,求和等),通过此方法获取数据中有价值的知识。python中用groupby()函数进行分组处理。A正确
2.df.groupby(df["key"]):表示对数据框df中的数据进行分组处理,按照数据框df中的"key"列进行分组处理。函数的返回值是一个对象,不会改变原数据。B正确,C错误。
3.可以对分组后得到的对象进行组内计算,如对每组进行求和计算sum(),平均值计算mean(),最大值计算max(),最小值计算min(),参照附图2。D正确
● 附图
图1 groupby函数处理数据,以及验证函数返回值
图2 对分组后的数据进行组内运算
图3 groupby函数处理后原数据未改变
● 附图代码
import pandas as pd
import numpy as np
data = {'name':["anna","ken","sara","bob","jerry"],
'gender':['female','male','female','male','male'],
'Age':[32,12,56,28,34],
'a':[3,4,1,7,8]
}
data1 = pd.DataFrame(data)
print (data1)
grouped = data1.groupby('gender')
print(grouped)
print(grouped.mean())
print(grouped.max())
print(grouped.sum())
● 正确答案
C
欢迎大家转发,一起传播知识和正能量,帮助到更多人。期待大家提出宝贵改进建议,互相交流,收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:http://liujingwei.cn