案例目标:根据房子特征,预测某房房价,选出最优模型。
主要步骤:
1. 数据清洗。数据分类,缺失值和异常值处理。
2. 特征分析。统计量分析和相关性分析。
3. 特征工程。特征选择和特征融合。
4. 模型构建。特征标准化,交叉验证,GBoost和Xgboost。
5. 模型评价。
1. 数据清洗
1.1数据分类。除SalePrice,所有数据按照数值类型(numerical)和类别类型(category)分类。
1.2 缺失值处理
整合缺失值信息。
案例目标:根据房子特征,预测某房房价,选出最优模型。
主要步骤:
1. 数据清洗。数据分类,缺失值和异常值处理。
2. 特征分析。统计量分析和相关性分析。
3. 特征工程。特征选择和特征融合。
4. 模型构建。特征标准化,交叉验证,GBoost和Xgboost。
5. 模型评价。
整合缺失值信息。