数据挖掘之过程模型
一业务理解阶段
确立业务目标、进行环境评估、确定DM目标、产生项目计划
需要生产文档:
业务背景报告、业务目标报告、业务成功难则、资源清单、需求、假设、限制、风险和对策、成本和效益分析报告、数据挖掘目标、术语表、项目成功法则:项目计划、工具和技术初步评价
二数据理解
收集初始数据、描述数据、探测数据、检验数据质量
需要生产文档:
初始数据收集报告、数据描述报告、数据探测报告、数据质量报告
三数据准备
数据提取、数据清洗、数据结构的构建、数据集成与格式化
需要生产文档:
数据提取的基本原则、数据清洗报告、数据属性与报告、合并的数据、格式化的数据
四建立模型
选择建模技术、进行测试设计、建立模型、评估模型
需要生产文档:
建模技术、建模前提、设定模式参数、模型及其描述、模型的评价、设定修改的参数
五评价
评价挖掘结果、复审过程、确定下阶段计划
需要生产文档:
结果评估报告、过程复审报告、确定下一步的方案和对策
六实施
计划实施、计划检查和维护、回顾项目产生总结报告
需要生产文档:
实施计划、检查和维护计划、总结报告、归纳文档