探索Chipotle快餐数据
作为一个Pandas初学者,今天用这道题目练手,分享出来
首先
impotr pandas as pd
(1)将数据集存入一个名为chipo的数据框内
iris_filename = 'chipotle.csv'
chipo = pd.read_csv(iris_filename, sep=',', decimal='.')
(2)查看前10行内容
chipo.head(10)
(3)数据集中有多少个列(columns)?
chipo.shape[1]
(4)打印出全部的列名称
list(chipo)
(5)数据集的索引是怎样的?
chipo.index
(6)被下单数最多商品(item)是什么?
c = chipo.groupby('item_name')
c = c.sum()
c = c.sort_values(['quantity'],ascending = False)
c.head(1)
(7)在item_name这一列中,一共有多少种商品被下单?
chipo['item_name'].unique()
(8)一共有多少个商品被下单?
chipo['quantity'].sum()
(9)将item_price转换为浮点数
chipo['item_price'] = chipo['item_price'].apply(lambda x: float(x[1:]))
chipo.item_price.dtype#打印一下类型是否成功转化
(10) 在该数据集对应的时期内,收入(revenue)是多少?
(chipo['quantity'] * chipo['item_price']).sum()
(11)在该数据集对应的时期内,一共有多少订单?
chipo['order_id'].nunique()
(12)每一单(order)对应的平均总价是多少?
chipo['item_price_sum'] = chipo['quantity'] * chipo['item_price']
(chipo[['order_id','item_price_sum']].groupby(by=['order_id']).sum()).mean()
数据表Github链接:https://github.com/Booting-O/Pandas-Practice.git