【数据分析day04】pandas数据处理三:数据聚合&“高级”数据聚合

数据聚合是数据分析的关键步骤,包括分组、聚合和合并。通过groupby()函数进行分组,利用聚合函数计算每组的统计量。在高级数据聚合中,可以使用pd.merge()结合add_prefix()进行结果合并,并通过transform或apply实现更复杂的操作。apply()函数尤其强大,能处理包括字符串在内的各种数据类型。
摘要由CSDN通过智能技术生成

pandas数据处理三:数据聚合&高级数据聚合

数据聚合

  • 数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值。
  • 数据分类处理:
    • 分组:先把数据分为几组
    • 聚合 , 求分组组内的数据聚合
    • 合并:把不同组得到的结果合并起来
  • 数据分类处理的核心: groupby()函数

例子:统计出color的总price, 再合并到原表种

	df = DataFrame({'color':['red','white','red','cyan','cyan','green','white','cyan'],
            'price':np.random.randint(0,8,size = 8),
            'weight':np.random.randint(50,55,size = 8)})
	df

在这里插入图片描述
分组

# 分组
df.groupby(by='color')

在这里插入图片描述

使用.groups属性查看各行的分组情况:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值