数据挖掘理论(一)

目录

为什么进行数据挖掘? 

什么是数据挖掘?

数据挖掘的流程 

在什么数据上进行挖掘?

可以挖掘什么类型的数据?

数据来源


为什么进行数据挖掘? 

我们拥有丰富的数据,但缺乏有用的信息。解决方法是:数据仓库技术和数据挖掘技术。

数据仓库(Data Warehouse)和在想分析处理(OLAP)-----为数据的存储和管理提供了基础。

数据挖掘(Data Mining):在大量的数据中挖掘感兴趣的知识(规则、规律、模式、约束) 

什么是数据挖掘?

数据挖掘就是从数据中发现知识,具体的说,就是从大量的数据当中挖掘出令人感兴趣的、有用的、隐含的、先前未知的、但又可能有用的模式或知识。数据挖掘又称KKD(数据库中的知识挖掘Knowledge-Discovery in Databases)、知识提炼、数据/模式分析、数据考古、数据捕捞、信息收获等等。

数据挖掘的流程 

1、了解应用领域

2、创建目标数据集

3、选择数据,数据清洗和预处理,数据压缩和变换(其中数据预处理是耗时耗力的过程,占整个流程的60%-80%的时间)

4、选择数据挖掘的技术、功能和合适的算法,进行数据挖掘

5、寻找感兴趣的模式

6、模式评估

7、知识表示

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值