数据分析项目复习(FIFA2018)

import numpy as np
import pandas as pd
import matplotlib as plt
#加载数据文件
df = pd.read_csv('D:\桌面\Python\pythonCourse\第九章-四个实例\Python案例数据\Python妗堜緥\FIFA_2018_player.csv')
#简单浏览数据信息:重点看看列名,数据类型
df.head()
#浏览数据的整体情况(也是用来看看异常值的基本手段)
df.describe()
#看看名字这一列有没有空值
df[df.name.isnull()]
#看看全名这一列有没有空值
df[df.full_name.isnull()]
#看看国籍这一列有没有空值
df[df.nationality.isnull()]
#看看联赛这一列又没有空值
df[df.league.isnull()]
#删除联赛名为空的数据 通过.index锁定行(也就是某条数据)
df.drop(df[df.league.isnull()].index, inplace=True)
#看看删除成功没有呢
df[df.league.isnull()]
#看看俱乐部有没有空值
df[df.club.isnull()]
#在前面的describe中我们注意到年龄的最小值是16,那么有没有问题呢?
df[df.age == 16] #df[df['age'] == 16]
#在前面的describe注意到薪酬的最小值出现0,重点来看看这些数据
df[df['eur_value'] < 1000]
#用薪酬的平均值来填充这些薪酬为0的数据列,如果数据量少也可以直接删除
df['eur_value'].replace(0,df['eur_value'].mean(), inplace = True)
#看看填充后还有没有异常情况
df[df['eur_value'] < 1000]
#周薪是否
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值