Pandas数据分析初学--开始了解数据

探索Chipotle快餐数据

作为一个Pandas初学者,今天用这道题目练手,分享出来

首先

impotr pandas as pd

(1)将数据集存入一个名为chipo的数据框内

iris_filename = 'chipotle.csv'
chipo = pd.read_csv(iris_filename, sep=',', decimal='.')

(2)查看前10行内容

chipo.head(10)

(3)数据集中有多少个列(columns)?

chipo.shape[1]

(4)打印出全部的列名称

list(chipo)

(5)数据集的索引是怎样的?

chipo.index

(6)被下单数最多商品(item)是什么?

c = chipo.groupby('item_name')
c = c.sum()
c = c.sort_values(['quantity'],ascending = False)
c.head(1)

(7)在item_name这一列中,一共有多少种商品被下单?

chipo['item_name'].unique()

(8)一共有多少个商品被下单?

chipo['quantity'].sum()

(9)将item_price转换为浮点数

chipo['item_price'] = chipo['item_price'].apply(lambda x: float(x[1:]))
chipo.item_price.dtype#打印一下类型是否成功转化

(10) 在该数据集对应的时期内,收入(revenue)是多少?

(chipo['quantity'] * chipo['item_price']).sum()

(11)在该数据集对应的时期内,一共有多少订单?

chipo['order_id'].nunique()

(12)每一单(order)对应的平均总价是多少?

chipo['item_price_sum'] = chipo['quantity'] * chipo['item_price']
(chipo[['order_id','item_price_sum']].groupby(by=['order_id']).sum()).mean()

数据表Github链接:https://github.com/Booting-O/Pandas-Practice.git

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值