python足球数据分析_FIFA2018球员数据分析---使用python进行数据分析的基本步骤

最新推荐文章于 2021-09-26 14:00:00 发布

weixin_39612122

最新推荐文章于 2021-09-26 14:00:00 发布

阅读量539

点赞数

文章标签： python足球数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39612122/article/details/111434149

版权

本文介绍了使用Python进行FIFA2018球员数据分析的基本步骤，包括数据清洗、处理缺失值以及对球员年龄、国籍和联赛分布的初步探索。通过读取CSV数据，利用pandas库进行数据处理，展示了如何计算统计指标、查找并处理缺失值，并绘制了各联赛球员数量的统计结果。

摘要由CSDN通过智能技术生成

1.明确数据分析的目的：了解FIFA2018球员整体情况

2.获得数据(一般来源于公司或网络等)

3.数据清洗(选用不同的工具，可使用excel,python,R,mysql等，本次分析使用python语言进行清洗和分析，使用的工具为jupyter notebook)

4.选择不同的维度对数据进行分析

importnumpy as npimportpandas as pdimportmatplotlib.pyplot as plt

df=pd.read_csv('./FIFA_2018_player.csv')#数据的总体描述

df.describe()

#计算每列的行数，可以看出有没有null值

df.count()

ID 17994

name 17994

full_name 17994

nationality 17994

league 17741

club 17741

age 17994

birth_date 17994

height_cm 17994

weight_kg 17994

eur_value 17994

eur_wage 17994

dtype: int64

#获取league为null的数据

df[df['league'].isnull()]#删除league为null的数据

df.drop(df[df.league.isnull()].index,inplace=True)

#使用平均值填充

df['eur_value'].replace(0,df['eur_value'].mean(),inplace=True)

#分析的维度和指标(平均数，最大数，最小数......)#维度：从数据选出一列或多列作为一个维度，例如国家，国家俱乐部离散型和连续型的#离散型的维度按照groupby 进行计算指标

nationality_data=df.groupby('nationality',as_index=False).count()[['nationality','name']]

nationality_data.rename(columns={'name':'player_count'},inplace=True)#按照运动员数量排名

nationality_sorted_data=nationality_data.sort_values('player_count',ascending=False)#运动员数量大于100的国家列表

nationality_sorted_data[nationality_sorted_data['player_count']>100]

#连续型的维度统计指标年龄

bins=np.arange(15,50,5)#使用cut将age归为具体的组

bins_data=pd.cut(df['age'],bins)#然后按照归好的组将数据进行分组，统计每组的数据

bins_count=df['age'].groupby(bins_data).count()

bins_count#画直方图#plt.hist(df['age'],bins)

#各大联赛运动员数量

league_data=df.groupby('league',as_index=False).count()[['league','ID']].sort_values('ID',ascending=False)

league_data.rename(columns={'ID':'player_count'},inplace=True)

league_data

weixin_39612122

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python足球数据分析_FIFA2018球员数据分析---使用python进行数据分析的基本步骤

1.明确数据分析的目的：了解FIFA2018球员整体情况2.获得数据(一般来源于公司或网络等)3.数据清洗(选用不同的工具，可使用excel,python,R,mysql等，本次分析使用python语言进行清洗和分析，使用的工具为jupyter notebook)4.选择不同的维度对数据进行分析importnumpy as npimportpandas as pdimportmatplotlib....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。