1、提出问题
解决的问题是什么
2、获取数据
3、数据预处理
3.1 数据查看和探索
通过一些图标查看数据的情况,包括数据分布,数据的缺失值情况,最大最小值等
3.2 数据清洗
缺失值替换,异常值删除等
3.3 特征工程
特征选择
特征的离散化,归一化
数据降维等
分组替换等,探索进行绘图,最大值最小值查看等,数据之间的相关性数据探索也是为了特征的提取和处理
4、数据建模分析
建模
5、结果展示(可视化,报告)
图表,报告等
【2】这个比较全面
https://blog.csdn.net/u013480893/article/details/90195725?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7Edefault-5.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7Edefault-5.control
【3】大案例了解数据分析的步骤
https://zhuanlan.zhihu.com/p/136819457