报错
inouts.mean 不能计算Alley那列, 不能处理文字
处理方法 只让算数值类型的
inputs = inputs.fillna(inputs.mean(numeric_only=True))
或者
inputs = inputs.fillna(inputs.select_dtypes(include='number').mean())
用第一种, 比较帅
pandas删除最多缺失值的列 方案1
# pandas删除最多缺失值的列
# 判断缺乏值,有则为True
print(inputs.isnull())
# 计算列中缺乏值得总数
print(inputs.isnull().sum())
# 得到最大缺失值的索引
print(inputs.isnull().sum().idxmax())
inputs = inputs.drop(inputs.isnull().sum().idxmax(), axis=1)
print(inputs)
pandas删除最多缺失值的列 方案2
# 直接按列得到非缺失值的个数
print(inputs.count(axis='index'))
inputs = inputs.drop(inputs.count(axis='index').idxmin(), axis=1)
print(inputs)