一、数据的预处理
1.1 缺失值处理
1.2 异常值
1.3 数据的变换
1.4 数据的描述性统计分析
此部分前几年有篇优秀论文写的很好,可以参考。
1.5 数据的可视化
1.6 数据降维
二、回归分析(重点)
三、机器学习
四、其他数据建模方法
五、葡萄酒评价问题(重点)
5.1 问题重述
5.2 问题一求解
用t检验对显著性差异进行评判,用方差对结果进行评判。
5.3 问题二求解
分级即分类,该问题为一个聚类问题,该论文用了K均值聚类,层次聚类,模糊C聚类对问题进行分类。针对理化指标,用了PCA进行降维后再聚类;针对质量,直接对数据运用三种聚类方法进行分类,最后对两种分类结果进行分析。
5.3 问题三求解(重点)
5.3 问题四求解