_[ https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14
](https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14) __
_
练习1-开始了解你的数据
步骤6 数据集中有多少个列(columns): chipo . shape [ 1 ]
步骤9 被下单数最多商品(item)是什么: chipo . item_name . value_counts ()
. head ( 1 ) value_counts 默认从大到小排序
步骤10 在item_name这一列中,一共有多少商品被下单: chipo . item_name . nunique
() nunique()???
步骤13 将item_price转换为浮点数: dollarizer = lambda x : float (
x [ 1 : - 1 ]) ???
chipo . item_price = chipo . item_price . apply (
dollarizer )
练习2-数据过滤与排序
步骤5 有多少球队参与了2012欧洲杯: euro12 . shape [ 0 ] 与练习题1步骤6的区别
步骤6 该数据集中一共有多少列(columns): euro12.info() 与练习题1步骤6的区别
步骤8 对数据框discipline按照先Red Cards再Yellow Cards进行排序: discipline .
sort_values ([ ‘Red Cards’ , ‘Yellow Cards’ ], ascending =
False )
步骤9 计算每个球队拿到的黄牌数的平均值: round ( discipline [ ‘Yellow Cards’ ]
. mean ())
步骤11 选取以字母G开头的球队数据: euro12 [ euro12 . Tea m . str .
s tartswith ( ‘G’ )]
步骤14 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy):
euro12 . loc [ euro12 . Team . isin ([ ‘England’ ,
‘Italy’ , ‘Russia’ ]), [ ‘Team’ , ‘Shooting Accuracy’ ]]
练习3-数据分组
步骤8 打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值: drinks . groupby (
‘continent’ <