import pandas as pd
df = pd.read_csv(r’E:\py-code\test1\MachineLearning\datas\titanic.csv’)
① 显示每个列有缺失值的比例
缺失数量/总数量
m = df.shape[0]
print(df.isnull().sum() / m)
② 将age字段使用众数做缺失值填充
print(df[‘Age’].mode())
df[‘Age’] = df[[‘Age’]].fillna(24)
print(df[‘Age’])
③ 将其他有缺失数据删除
df.dropna(inplace=True)
④ 将处理后的数据保存为1.csv
df.to_csv(‘1.csv’)