EDM营销中,进行数据挖掘是一项很重要的工作。数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。具体可以参考:http://baike.baidu.com/view/7893.htm

数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。关于数据挖掘方面的工作,可以参考:http://www.cnblogs.com/EDM-DATA/archive/2012/06/16/2551784.html,博主也一直在做这方面的工作,联系博主QQ:2281951699.

这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。

数据挖掘完整的步骤如下:

  ① 理解数据和数据的来源(understanding)。
  ② 获取相关知识与技术(acquisition)。
  ③ 整合与检查数据(integration and checking)。
  ④ 去除错误或不一致的数据(data cleaning)。
  ⑤ 建立模型和假设(model and hypothesis development)。
  ⑥ 实际数据挖掘工作(data mining)。
  ⑦ 测试和验证挖掘结果(testing and verification)。
  ⑧ 解释和应用(interpretation and use)。

因此,由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。