1. 数据分析与数据挖掘
1.1 数据分析
定义:数据分析是指采用适当的统计分析方法对收集到数据进行、概括和总结,对数据进行恰当地描述提取出有用的信息过程
例:连锁超市对上季度各种商品的销售量进行统计和分析,得出各种商品需求量和销售曲线,采购部门依次为依据进行采购策略调整
常见图:排列图,因果图,散布图,直方图,控制图
1.2 数据挖掘
数据挖掘 (Data Mining,DM) 是指从海量的数据中通过相关算法来发 现隐藏在数据中的规律和知识过程 。
为什么进行数据挖掘?
- 数据的爆炸式增长 : 从TB 到PB
- 数据是丰富的,急需发现知识 数据是丰富的,急需发现知识 !
通常 将数据 挖掘视为中“知识发现 ”的同义词,也可以认为数据挖掘是知识发现中的一个步骤。
1.3 知识发现(KDD)的过程
重点
1.4 数据分析与数据挖掘的区别
1.5 数据分析与数据挖掘的联系
- 数据分析的结果往需要进一步挖掘才能得到更加清晰,而数据挖掘发现知识的过程也需要对先验约束进行一定调整而再次进行数据分析。
- 数据分析可以将变成信息,而挖掘知识如果需要从数据中发现知识,往需要分析和挖掘相互配合共同完成任务。
2. 分析与挖掘的数据类型
2.1 数据库数据
数据库系统(DataBase System