学习介绍:
经过python基础的学习,利用一个数据分析实战,实现数据分析。学习内容目录:
1、 数据导入 2、处理 3、 排序 4、 相关性分析 5、筛选学习内容:
一、数据集下载
!wget -O pokemon_data.csv https://pai-public-data.oss-cn-beijing.aliyuncs.com/pokemon/pokemon.csv
二、程序分析:
#导入包
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
#pandas读取数据
df = pd.read_csv("./pokemon.csv")
获取数据基本信息可以用df.shape或者df.info
观察数据是否有缺失:
# 计算出每个特征有多少百分比是缺失的
percent_missing = df.isnull().sum() * 100 / len(df)
missing_value_df = pd.DataFrame({
'column_name': df.columns,
'percent_missing': percent_missing
})
# 查看Top10缺失的
print(missing_value_df.sort_values(by='percent_m