题目链接:https://www.kesci.com/home/project/5f1815b594d484002d2ba46a
题目数据连接里找,官方的答案有些错误,这里是个人的答案以及一些总结。
问题一:步骤1 导入必要的库
import pandas as pd
(不做说明了)
步骤2 从如下地址导入数据集
步骤3 将数据集存入一个名为chipo的数据框内
(这里一步做了)
chipo = pd.read_csv(r'C:\Users\G\Desktop\exercise_data\chipotle.tsv',sep = '\t')
(这个数据文件不是csv格式的而是tsv格式的,有关这两者的区别
tsv与csv的区别:tsv采用的是制表分隔符也就是’\t’,而csv采用的是逗号分隔符’,‘所以sep的参数也就设置为了’\t’)
步骤4 查看前10行内容
chipo.head()
chipo.tail()
默认查看5行,括号里填写查看的行数,10,20等
步骤6 数据集中有多少个列(columns)
chipo.shape[1]
shape[]中的参数,查找列为1,查找行为0,关于对DateFrame中1和0的理解:DateFrame中的1和0是按照行列式来设计的,0为行,1为列。
#shape传入0表示行的形状也就是数量,1则表示列的形状也就是有多个列
步骤7 打印出全部的列名称
chipo.columns
#在DateFrame中的对行的操作基本都是columns
步骤8 数据集的索引是怎样的
chipo.index
步骤9 被下单数最多商品(item)是什么?
解法一:
c = chipo[['item_name','quantity']].groupby(