import pandas as pd
import numpy as np
获取数据集
导入数据集至chipochipo = pd.read_csv(url,sep = '\t')
设置打印宽度pd.set_option('display.width',1000)
查看前10行数据print(chipo.head(10))
了解数据集中有多少个观察值
print(chipo.info())
了解数据集中有多少列print(chipo.shape[1])
打印出全部列的名称print(chipo.columns)
输出数据集的索引print(chipo.index)
被下单数最多的商品(item)是什么print(chipo.item_name.value_counts().head(1))
在item_name这一列中总共有多少商品被下单print(chipo.item_name.nunique())
在choic_description中,下单次数最多的商品是什么print(chipo.choice_description.value_counts().head(1))
一共有多少商品下单?print(chipo.quantity.sum())
将item_price转换为浮点数dollarizer = lambda x: float(x[1:-1])
chipo.item_price = chipo.item_price.apply(dollarizer)
print(chipo.item_price)
在该数据集对应的时期内,收入是多少
print(chipo.item_price.sum())
在该数据集内,一共有多少订单print(chipo.order_id.value_counts().count())
每一单的对应评价总价时多少order_grouped = chipo.groupby(by=['order_id']).sum()
avgsum = order_grouped.mean()['item_price']
print(avgsum)
print(chipo.groupby(by=['order_id']).sum().mean()['item_price'])
一共有多少种不同的商品被售出print(chipo.item_name.value_counts().count())
本文由 所长 创作,采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
最后编辑时间为: Apr 21, 2018 at 10:22 am