数据挖掘技术-使用groupby方法拆分数据

使用groupby方法拆分数据

  1. 准备数据

准备数据meal_order_info.csv,并将meal_order_info.csv数据放到Linux本地/course/DataAnalyze/data目录。

  1. 使用groupby方法拆分数据
  1. 以T餐饮企业的菜品订单详情表为例,依据订单编号对数据进行分组,如代码 41所示。

代码 41 对菜品订单详情表依据订单编号分组

In[1]:

import pandas as pd

import numpy as np

import os

os.chdir(‘/course/DataAnalyze/data’)

detail= pd.read_csv ('meal_order_detail1.csv')

detailGroup = detail[['order_id','counts','amounts']].groupby(by = 'order_id')

print('分组后的订单详情表为:',detailGroup)

Out[1]:

分组后的订单详情表为:<pandas.core.groupby.groupby.DataFrameGroupBy object at 0x0000000008A9DE48>

  1. T餐饮企业的菜品订单表经过分组操作后每一组的均值,标准差,中位数如代码 42所示。

代码 42 GroupBy类求均值,标准差,中位数

In[2]:

print('订单详情表分组后前5组每组的均值为:\n', detailGroup.mean().head())

Out[2]:

订单详情表分组后前5组每组的均值为:

           counts  amounts

order_id

1002      1.0000   32.000

1003      1.2500   30.125

1004      1.0625   43.875

1008      1.0000   63.000

1011      1.0000   57.700

In[3]:

print('订单详情表分组后前5组每组的标准差为:\n', detailGroup.std().head())

Out[3]:

订单详情表分组后前3组每组的标准差为:

            counts    amounts

order_id

1002      0.00000  16.000000

1003      0.46291  21.383822

1004      0.25000  31.195886

1008      0.00000  64.880660

1011      0.00000  50.077828

In[4]:

print('订单详情表分组后前5组每组的大小为:','\n', detailGroup.size().head())

Out[4]:

订单详情表分组后前5组每组的大小为:

order_id

1002     7

1003     8

1004    16

1008     5

1011    10

dtype: int64

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

知识世界

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值