数据挖掘的过程基本分为以下6个步骤:
1. 商业理解:数据挖掘不是我们的目的,我们的目的是更好的帮助业务,所以第一步我们要从商业的角度理解项目需求,在这个基础上,在对数据挖掘的目标进行定义
2.数据理解:尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等。这有助于对收集的数据有个初步的认知。
3.数据准备:开始收集数据,并对数据进行清洗、数据集成等操作,完成数据挖掘前的准备工作。
**4.模型建立:**选择和应用各种数据挖掘模型,并进行优化,一遍得到更好的分类结果。
**5.模型评估:**对模型进行评价,并检查构建模型的每个步骤,确认模型是否实现了预定的商业目标。
**6.上线发布:**模型的作用是从数据中找到近况,也就是我们所说的“知识”,获得的知识转化成用户可以使用的方式,呈现的形式可以使一份报告,也可以是实现一个比较复杂的、可重复的数据挖掘过程。