python数据分析小练习----科赛

最新推荐文章于 2024-08-22 00:03:42 发布

harry_hurry

最新推荐文章于 2024-08-22 00:03:42 发布

阅读量8.3k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/harry_hurry/article/details/80005882

版权

本文介绍了通过Python进行数据分析的多个练习，涉及数据集的了解、过滤、排序、分组、数据类型转换、合并、统计、可视化等操作。通过这些练习，读者可以掌握pandas库的常用函数，如shape、value_counts、nunique、apply、merge、agg、set_index、sort_values、resample等，以及处理时间序列数据和缺失值的方法。

摘要由CSDN通过智能技术生成

https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14

练习1-开始了解你的数据

步骤6 数据集中有多少个列(columns)：chipo.shape[1]

步骤9 被下单数最多商品(item)是什么：chipo.item_name.value_counts().head(1) value_counts 默认从大到小排序

步骤10 在item_name这一列中，一共有多少商品被下单：chipo.item_name.nunique() nunique()？？？

步骤13 将item_price转换为浮点数：dollarizer = lambda x: float(x[1:-1]) ？？？

chipo.item_price = chipo.item_price.apply(dollarizer)

练习2-数据过滤与排序

步骤5 有多少球队参与了2012欧洲杯：euro12.shape[0] 与练习题1步骤6的区别

步骤6 该数据集中一共有多少列(columns)：euro12.info() 与练习题1步骤6的区别

步骤8 对数据框discipline按照先Red Cards再Yellow Cards进行排序：discipline.sort_values(['Red Cards', 'Yellow Cards'], ascending = False)

步骤9 计算每个球队拿到的黄牌数的平均值：round(discipline['Yellow Cards'].mean())

步骤11 选取以字母G开头的球队数据：euro12[euro12.Team.str.startswith('G')]

步骤14 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)：euro12.loc[euro12.Team.isin(['England', 'Italy', 'Russia']), ['Team','Shooting Accuracy']]

练习3-数据分组

步骤8 打印出每个大陆对spirit饮品消耗的平均值，最大值和最小值：drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max'])

练习4-Apply函数

步骤4 每一列(column)的数据类型是什么样的：crime.info()

步骤5 将Year的数据类型转换为 datetime64：crime.Year = pd.to_datetime

最低0.47元/天解锁文章

关注

0
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。