数据挖掘是一个过程,是一个以数据为中心的循序渐进的螺旋式数据探索过程。
![上图指出,数据挖掘时一个以数据为核心多个环节紧密相连,循环反复且循序渐进的数据探索过程](https://img-blog.csdnimg.cn/20190404202741100.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAzMDU3Nw==,size_16,color_FFFFFF,t_70)
一、数据挖掘方法论的各环节:
1.业务理解
2.数据理解
3.数据准备
4.建立模型
5.方案评估
6.方案实施
二、数据挖掘的任务和应用:
1.数据总结
2.分类和回归
3.聚类分析
4.关联分析
三、数据挖掘得到的只是形式:
1.浓缩数据
2.树形图
3.规则
4.数学模型
四、数据挖掘算法的分类:
1.根据算法分析数据的方式划分
2.根据算法来自的学科划分
3.根据算法所得结果的类型划分
4.根据学习过程的类型划分
首先来了解一下Modeler的数据集成:
一、从数据挖掘角度看变量类型:
连续数值型:表示年龄、家庭人口数等。
二分类型,简称分类型:表示性别等。
多分类型,也称名义型:表示职业、籍