python数据分析小练习----科赛

https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14 

练习1-开始了解你的数据

步骤6 数据集中有多少个列(columns):chipo.shape[1]

步骤9 被下单数最多商品(item)是什么:chipo.item_name.value_counts().head(1)  value_counts 默认从大到小排序

步骤10 在item_name这一列中,一共有多少商品被下单:chipo.item_name.nunique()   nunique()???

步骤13 将item_price转换为浮点数:dollarizer = lambda x: float(x[1:-1]) ???

                          chipo.item_price = chipo.item_price.apply(dollarizer)  



练习2-数据过滤与排序

步骤5 有多少球队参与了2012欧洲杯:euro12.shape[0]     与练习题1步骤6的区别

步骤6 该数据集中一共有多少列(columns):euro12.info()  与练习题1步骤6的区别

步骤8 对数据框discipline按照先Red Cards再Yellow Cards进行排序:discipline.sort_values(['Red Cards', 'Yellow Cards'], ascending = False)

步骤9 计算每个球队拿到的黄牌数的平均值:round(discipline['Yellow Cards'].mean())

步骤11 选取以字母G开头的球队数据:euro12[euro12.Team.str.startswith('G')]

步骤14 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy):euro12.loc[euro12.Team.isin(['England', 'Italy', 'Russia']), ['Team','Shooting Accuracy']]


练习3-数据分组

步骤8 打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值:drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max'])



练习4-Apply函数

步骤4 每一列(column)的数据类型是什么样的:crime.info()

步骤5 将Year的数据类型转换为 datetime64:crime.Year = pd.to_datetime

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值