数据来源:
数据集:
https://www.kaggle.com/datasets/bryanb/fifa-player-stats-database
所有数据爬取自:https://sofifa.com/
数据字段:
基础数据:
ID标识、Name名字、Age年龄、Nationality国籍、Overall总评、Best Overall Rating最佳位置评分、Potential潜力、Club俱乐部、International Reputation声誉
身体数据:
Preferred Foot惯用脚、Weak Foot逆足、Skill Moves花式、Work Rate攻守参与度、Body Type体型、Height身高、Weight体重
进攻数据:
Crossing传中、Finishing射门、HeadingAccuracy头球、ShortPassing短传、Volleys凌空
技术数据:
Dribbling盘带、Curve弧线、FKAccuracy定位球、LongPassing长传、BallControl控球
运动数据:
Acceleration加速、SprintSpeed速度、Agility敏捷、Reactions反应、Balance平衡
力量数据:
ShotPower射门力量、Jumping弹跳、Stamina体力、Strength对抗、LongShots远射
心理数据:
Aggression侵略、Interceptions拦截、Positioning跑位、Vision视野、Penalties点球、Composure镇定
防守数据:
Marking盯防、StandingTackle抢断、SlidingTackle铲球、DefensiveAwareness防守意识
守门数据:
GKDiving扑救、GKHandling手型、GKKicking开球、GKPositioning站位、GKReflexes反应
数据分析流程:
-
对数据进行加工
先把既不属于数值属性又不属于类型属性的ID标识、Nationality国籍、Club俱乐部删掉。
Marking盯防数据应该是老版本的FIFA才有的数据,新版本已经删除,该列可直接删除。
2.对数据指标进行描述性分析,分析数据指标的缺失值、异常值、数据集中趋势、数据离散趋势进行分析,并进行数据预处理