分析思路:
1、明确分析目标;
2、导入库、导入数据;
3、简单查看下数据行列、整体情况;
4、数据清洗;
5、确定维度和指标;
6、分析并作图
1、查看整体数据情况
1.1引入使用的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
1.2加载数据文件
df = pd.read_csv('./FIFA_2018_player.csv')
1.3简单查看数据整体情况
df.head()
数据表头说明:
ID:编号
name:球员姓名
full_name:球员全名
nationality:国籍
league:联赛
club:所属俱乐部
age:年龄
birth_date:出生日期
height_cm:身高
weight_kg:体重
eur_value:身价
eur_wage:周薪
df.describe()
2、开始清理数据
数据清理-所有需要分析的数据都需要看下。
对于数值型,可以看下describe方法输出的信息,重点关注最大值,最小值,平均值,行数等。
2.1、查看整体数据量
f.count()