Pandas数据处理之高级聚合

import numpy as np
from pandas import DataFrame, Series
import pandas as pd

'''
假设菜市场张大妈在卖菜,有以下属性:
菜品(item):萝卜,白菜,辣椒,冬瓜
颜色(color):白,红,青
重量(weight)
价格(price)
1.要求以属性作为列索引,新建一个df
2.对df进行聚合操作,求出颜色为白色的价格总和
3.对df进行聚合操作,求出萝卜的所有重量(包括白萝卜,胡萝卜,青萝卜)以及平均价格
4.使用merge合并总重量及平均价格
'''
# 1.要求以属性作为列索引,新建一个df
df = DataFrame({"item": ["萝卜", "白菜", "辣椒", "冬瓜", "白菜", "辣椒", "冬瓜", "白菜"],"color": ["红", "白", "青", "青", "白", "青", "白","白"],"weight": np.random.randint(5, 150, size=8),
"price": np.random.randint(1, 4,size=8)})
print(df)

# 2.对df进行聚合操作,求出颜色为白色的价格总和
print("颜色为白色的价格总和为:%d元" % df.groupby("color")["price"].sum()["白"])

# 3.对df进行聚合操作,求出萝卜的所有重量(包括白萝卜,胡萝卜,青萝卜)以及平均价格
print(df.groupby("item")[["weight", "price"]].sum())
print(df.groupby("item")[["weight", "price"]].apply(sum))
print(df.groupby("item")[["weight", "price"]].apply(max))
# transform和apply都会进行运算,transform将运算出来的结果显示给所有的行
print(df.groupby("item")[["weight", "price"]].transform(sum))

'''6.0高级聚合
可以使用pd.merge()函数将聚合操作的计算结果添加到df的每一行中,使用groupby分组后调用加和等函数
进行计算,然后最后可以调用add_prefix()来修改列名'''
# 可以使用transform和apply实现相同功能

def add_all(item):
    a = 0
    for i in item:
        a += i
    return a
print(df.groupby("item")["price"].apply(add_all))   # add_all == sum



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值