多元回归分析数据集_数据分析实例——足球运动员数据集(1)

本文通过对2017年足球运动员数据集的分析,探讨球员的评分依据和技能等级评价标准。使用决策树进行初步建模,评估球员能力。后续将介绍更多机器学习方法的应用。
摘要由CSDN通过智能技术生成

22a72929e4106d9a64cbc26ac2d56270.png

又开始做实例了~在本次数据集中,包含了2017年所有活跃的足球运动员的个人数据,包括身高体重等基本数据,以及力量、速度、技巧等多个指标。C罗、梅西、内马尔,到底谁比较厉害呢?答案我们可以从数据中获得。(有意思~)

数据来源:

本次数据集的来源是kesci,提供者是Ustinian,想自己动手试试的同学可以去了解一下~

和鲸社区 - Kesci.com​www.kesci.com

下面开始我们的实例学习之路~

一、了解数据集

下面是和鲸社区中,对数据集的描述,主要包括了:数据集的主要内容、以及数据内的各个标签的中文注释。

(1)数据内容:

2017年所有活跃的足球运动员。

(2)数据说明(标签名):

Name 姓名
Nationality 国籍
National_Position 国家队位置
National_Kit 国家队号码
Club 所在俱乐部
Club_Position 所在俱乐部位置
Club_Kit 俱乐部号码
Club_Joining 加入俱乐部时间
Contract_Expiry 合同到期时间
Rating 评分
Height 身高
Weight 体重
Preffered_Foot 擅长左(右)脚
Birth_Date 出生日期
Age 年龄
Preffered_Position 擅长位置
Work_Rate 工作效率
Weak_foot 非惯用脚使用频率
Skill_Moves 技术等级
Ball_Control 控球技术
Dribbling 盘球(带球)能力
Marking 盯人能力
Sliding_Tackle 铲球
Standing_Tackle 逼抢能力
Aggression 攻击能力
Reactions 反击
Attacking_Position 攻击性跑位
Interceptions 抢断
Vision 视野
Composure 镇静
Crossing 下底传中
Short_Pass 短传
Long_Pass 长传
Acceleration 加速度
Speed 速度
Stamina 体力
Strength 强壮
Balance 平衡
Agility 敏捷度
Jumping 跳跃
Heading 投球
Shot_Power 射门力量
Finishing 射门
Long_Shots 远射
Curve 弧线
Freekick_Accuracy 任意球精准度
Penalties 点球
Volleys 凌空能力
GK_Positioning 门将位置感
GK_Diving 扑救能力
GK_Kicking 门将踢球能力
GK_Handling 扑球脱手几率
GK_Reflexes 门将反应度

(3)导入数据:

import numpy as np
import pandas as pd
df = pd.read_csv(r'C:UsersAdministratorDesktopzuqiu8543football.csv')

(4)查看数据基本信息:

df.head()

3d427d7a907be91f1640e0398bfe0d8b.png
df.shape

db966848ea5cf445244e791e043cb851.png

查看数据缺失情况:

df.isnull().sum(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值