https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14 练习1-开始了解你的数据 步骤6 数据集中有多少个列(columns):chipo.shape[1] 步骤9 被下单数最多商品(item)是什么:chipo.item_name.value_counts().head(1) value_counts 默认从大到小排序 步骤10 在item_name这一列中,一共有多少商品被下单:chipo.item_name.nunique() nunique()??? 步骤13 将item_price转换为浮点数:dollarizer = lambda x: float(x[1:-1]) ??? chipo.item_price = chipo.item_price.apply(dollarizer) 练习2-数据过滤与排序 步骤5 有多少球队参与了2012欧洲杯:euro12.shape[0] 与练习题1步骤6的区别 步骤6 该数据集中一共有多少列(columns):euro12.info() 与练习题1步骤6的区别 步骤8 对数据框discipline按照先Red Cards再Yellow Cards进行排序:discipline.sort_values(['Red Cards', 'Yellow Cards'], ascending = False) 步骤9 计算每个球队拿到的黄牌数的平均值:round(discipline['Yellow Cards'].mean()) 步骤11 选取以字母G开头的球队数据:euro12[euro12.Team.str.startswith('G')] 步骤14 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy):euro12.loc[euro12.Team.isin(['England', 'Italy', 'Russia']), ['Team','Shooting Accuracy']] 练习3-数据分组 步骤8 打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值:drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max']) 练习4-Apply函数 步骤4 每一列(column)的数据类型是什么样的:crime.info() 步骤5 将Year的数据类型转换为 datetime64:crime.Year = pd.to_datetime