数据分析项目-FIFA-2018 player

在这里插入图片描述

一:分析背景与目的

  1. 背景
    手头拿到一份FIFA-2018 player的数据,获得途径可以是:官方网站下载、相关数据网站下载、爬虫获得等等

  2. 分析目的
    对整体情况进行了解,用数据给球员做出规划参考,让球迷看到不一样的FIFA。(可能并不专业)

二:数据采集和处理

1、数据概况
describe一下数据源,可看到共计有17994条数据,6个描述列。
可以重点关注一下平均值,最大最小值。看看是否有需要清洗的数据。

# 导入模块
import pandas as pd
import numpy as py
import matplotlib.pyplot as plt
#导入数据
df = pd.read_csv('./FIFA_2018_player.csv')
#查看前5条数据
df.head()
#查看数据总体情况
df.describe()

在这11111里插入图片描述
对整体有了大体了解后,可以开始着手数据清洗,主要考虑清洗null值、重复值、异常值等。

#清洗数据
#先看看有没有null值
df[df.name.isnull()]
df[df.age.isnull()]
df[df.height_cm.isnull()]
df[df.weight_kg.isnull()]
df[df.eur_value	.isnull()]
df[df.eur_wage.isnull()]
#league 联赛是否有null值 对null怎么处理?对数据影响不大,可以删除
df[df.league.isnull()]
#删除null的index
df.drop(df[df.league.isnull()].index,inplace=True)
#看一下有没有重复值 可以是某列,某几列,全部
df[df.duplicated()]
#多列重复的
df[df[['full_name','club'
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值