2023.11.25 python常用数据集信息查看命令
在对数据集进行处理前一般需要对数据集先进行一个基本的观察,根据观察结果和经验确定处理方式。以kaggle员工离职数据集为例进行操作。
打印前5条数据
# 导入包
import pandas as pd
# 读入数据
df = pd.read_csv('HR_comma_sep.csv')
# 打印前五条数据
print(df.head())
查看数据信息
# 查看数据信息
print(df.info())
查看缺失值统计
# 查看缺失值统计
print(df.isnull().any().sum())
查看数据均值、中位数
# 查看数据均值、中位数
print(df.describe().T)