数据挖掘的过程一般有这么几步:
1. 数据预处理,如数据清洗,填补缺失值,填补缺失值方法很多,可以将缺失值较多的样本删除,
或者根据变量之间的相关关系和相似性填补
2. 获取预测模型,模型用来根据未来解释变量的值预测目标变量,也可以用来解释变量之间的相
互联系。根据问题的需要可以建立不同的模型。
3. 模型选择与评价,获得预测模型后,选择预测效果,稳定性最好的模型作为最终模型,评价模
型好不好的标准很多。
4. 用最终模型进行预测。
数据挖掘的过程一般有这么几步:
1. 数据预处理,如数据清洗,填补缺失值,填补缺失值方法很多,可以将缺失值较多的样本删除,
或者根据变量之间的相关关系和相似性填补
2. 获取预测模型,模型用来根据未来解释变量的值预测目标变量,也可以用来解释变量之间的相
互联系。根据问题的需要可以建立不同的模型。
3. 模型选择与评价,获得预测模型后,选择预测效果,稳定性最好的模型作为最终模型,评价模
型好不好的标准很多。
4. 用最终模型进行预测。