.groupby常用用法和解释
可以根据按单个指定的字段名进行分组
import pandas as pd
df = pd.read_csv("文件路径")
df["列名1"].groupby(df["列名2"])
“列名1”的数据,根据”列名2”的来分组展示
可以根据多个字段来分组
import pandas as pd
df = pd.read_csv("文件路径")
df["列名1"].groupby([df["列名2"],df["列名3"]])
根据多个字段分组时,需要把字段用列表括起来
搭配mean或者size使用
mean()是求均值
import pandas as pd
df = pd.read_csv("文件路径")
group = df["列名1"].groupby([df["列名2"],df["列名3"]])
group.mean()
将分组后的“列名1”的数据进行均值计算,按分组得出“列名1”平均值
要注意mean()结果只能显示数值的字段结果
size()是求分组的大小
import pandas as pd
df = pd.read_csv("文件路径")
group = df["列名1"].groupby([df["列名2"],df["列名3"]])
group.size()
对分组后的“列名1”的数据进行统计,继续符合该分组的结果有多少个