1. 提取有非法数据的列:
数据展示:
提取NaN数据的代码
# 不完整行的前五行
sample_incomplete_rows = housing[housing.isnull().any(axis=1)].head()#返回任意一行中有空列(即null或NaN)的数据,并取前五个展示
sample_incomplete_rows
# housing[housing.isnull().any(axis=1)]
2. 用中位数填充NaN数据
代码:
median = housing["total_bedrooms"].median() # 取“total_bedrooms”这一列的中位数
print(median)
sample_incomplete_rows["total_bedrooms"].fillna(median, inplace=True) # option 4 选择该列“total_bedrooms”数据的中位数填充NaN
sample_incomplete_rows
输出结果: