立即学习:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu
数据分析师的一天
1、数据分析的各个流程 semma
2、数据分析和数据挖掘区别
3、许菊分析需要掌握的技能
ROI 投资回报率 return on invastment
S 收集数据
基于需求,有针对性的搜集可以解决问题的数据。
E explore 数据探索
离散变量的分布比例
连续变量的分布形态
数据的异常和缺失
特征选择
以上数据的修补。
M:model 数据建模
数据建模:侧重于未知事件的预测常用的模型有
1、有监督的预测性模型回归、决策树、knn
2、有监督的判别性模型logistic 贝叶斯 集成算法等
3、无监督模型 kmeans聚类,层次聚类,密度聚类
4、半监督模型 (关联规则算法)
A :assess模型评估
模型评估,检验模型的稳定性和实用性,常用的方法有
RMSE预测性问题
混淆矩阵
ROC曲线
KS曲线
有没有更好的模型可以度量和预测现有的收入数据?
增加样本
拓展维度
修正模型参数
更换其他模型