这十套练习，教你如何使用Pandas做数据分析

最新推荐文章于 2022-09-13 21:50:26 发布

åå½ä¸«

最新推荐文章于 2022-09-13 21:50:26 发布

阅读量199

点赞数

本文链接：https://blog.csdn.net/weixin_43579863/article/details/107395384

版权

这里写目录标题

题目1.开始了解你的数据--探索Chipotle快餐数据
题目2.数据过滤与排序--探索2012欧洲杯数据

题目1.开始了解你的数据–探索Chipotle快餐数据

import pandas as pd
pd.set_option('display.max_columns',1000)
data = pd.read_csv(r'F:\Desktop\exercise_data\chipotle.tsv',sep='\t')
#查看前10行内容
print(data.head(10))
# 查看数据集尺寸（多少行多少列） 进一步的data.shape[0]--查看行数  data.shape[1]--查看列数
print('数据集尺寸：',data.shape)  #(4622, 5)    data.shape[0]--4622行  data.shape[1]--5列
#打印出全部的列名称
print('打印数据集列名：',data.columns)
#数据集的索引是怎样的
print('打印数据集的索引:',data.index)
#被下单数最多商品(item)是什么?
data_1 = data[['item_name','quantity']].groupby('item_name',as_index=False).agg('sum')
data_esc = data_1.sort_values(by='quantity',ascending=False)
print('被下单数最多商品(item)是:',data_esc.head(1))
 #在item_name这一列中，一共有多少种商品被下单？
data_unique = data['item_name'].nunique
print('在item_name这一列中，一共有多少种商品被下单',data_unique)
#在choice_description中，下单次数最多的商品是什么？
data_max = data['choice_description'].value_counts().head(1)
print(data_max)
# 将item_price转换为浮点数
dollarizer = lambda x: float(x[1:-1])
data['item_price'] = data['item_price'].apply(dollarizer)
print(data['item_price'])
print(data.info())
#在该数据集对应的时期内，收入(revenue)是多少
data['sub_total'] = round(data['quantity']*data['item_price'],2)
print('在该数据集对应的时期内，收入(revenue)是:',data['sub_total'].sum())

#在该数据集对应的时期内，一共有多少订单？
order_id_nunique = data['order_id'].nunique()
print('在该数据集对应的时期内，一共有订单:',order_id_nunique)

#每一单(order)对应的平均总价是多少？
order_id_mean = data[['order_id','sub_total']].groupby('order_id',as_index=False).agg({'sub_total':'sum'})
print('每一单(order)对应的平均总价是:',order_id_mean['sub_total'].mean())
print('每一单(order)对应的平均总价是:',round(order_id_mean['sub_total'].mean(),2) )

#一共有多少种不同的商品被售出？
print('一共有多少种不同的商品被售出:',data['item_name'].nunique())

题目2.数据过滤与排序–探索2012欧洲杯数据

åå½ä¸«

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
这十套练习，教你如何使用Pandas做数据分析

题目1.探索Chipotle快餐数据import pandas as pdpd.set_option('display.max_columns',1000)data = pd.read_csv(r'F:\Desktop\exercise_data\chipotle.tsv',sep='\t')#查看前10行内容print(data.head(10))# 查看数据集尺寸（多少行多少列）进一步的data.shape[0]--查看行数 data.shape[1]--查看列数print('数据集尺
复制链接

扫一扫