文章目录 背景介绍 收集数据(Gathering Data) 分析数据(Data analysis) 数据清洗 合并训练集和测试集 删除“Id”列 填充缺失值 填充数值型缺失值 填充非数值型缺失值 特殊列缺失值填充 特征工程 数据压缩 添加新的特征量 将分类转化成数值 分割训练集、验证集和测试集 将数据转化成NumPy格式</