整理笔记,记一下~
框架
内容
业务理解(Business Understanding)
深刻理解业务需求,在需求的基础上制定目标和实现目标的计划
数据理解(Data Understanding)
主要为收集数据、熟悉数据、识别数据的质量问题。
数据准备(Data Preparation)
从收集的数据种选择必要的属性,并按关联关系将它们连接成一个数据集,然后进行数据清洗,如空值和异常值处理、离群值剔除和数据标准化。
建模(Modeling)
选择和应用不同的模型技术,并确定模型的最佳参数。如果初步分析发现模型的效果不满意,要跳回数据准备阶段,甚至数据理解阶段。
评估(Evaluation)
对建立的模型进行可靠性评估和合理性解释。检查构造模型的步骤,确保模型可以完成业务目标。如果评估结果没有达到预想的业务目标,要再跳回业务理解阶段。
部署(Deployment)
根据评估后认为合理的模型,制定将其应用于实际工作的策略。