立即学习:https://edu.csdn.net/course/play/6861/326738?utm_source=blogtoedu
流程:SEMMA 流程
S:Sample 搜集数据,抽样
问卷、数据库、实验室、仪器设备记录
E:Explore 探索
离散变量分布比例、连续变量的分布形态(正态、偏态?)、数据的异常和缺失、特征选择
M:Modify 数据修正
类型转换、一致性处理(单位)、异常值和缺失值处理、数据形态的转换
M:Model 数据建模(挖掘要用)
A:Assess 模型评估
RMSE,KS
预测
分析与挖掘的区别:
数据分析需要技能:SQL 非常重要