立即学习:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu
SEMMA
S-Sample(搜集数据)
问卷调查
数据库查询
E-Explore(数据探索)
离散变量的分布比例
连续变量的分布形态
数据的异常和缺失
特征选择
M-Modify(数据修正)
数据类型的转换
数据的一致性处理
异常值和缺失值的处理
数据形态的转换
M-Model(数据建模)
有监督的预测性模型(回归 决策树 KNN等)
无监督的判别性模型(Logistic 贝叶斯 集成算法等)
无监督模型(Kmeans聚类 层次聚类 密度聚类等)
半监督模型(关联规则等)(不常用)
A-Assess(模型评估)
RMSE(预测性问题 均方)
混淆矩阵
ROC曲线
KS曲线