可以挖掘什么类型的数据?

数据挖掘的基础在于数据,只有有了充足的适合的数据作为基础,才可以利用各种技术挖掘发现知识。

那什么类型的数据才可以进行数据挖掘呢?

一、数据库数据

常见的数据库数据是关系数据库中的关系数据,存储的是一张张的表。每张表都存放大量的元组(行),和元组对应的属性(列)。

关系数据可以通过数据库查询语句进行查询,比如SQL语句。查询一些最大、最小、平均数等问题。

但是,当我们想要进一步的搜索数据的发展趋势或者数据模式的时候,就需要使用数据挖掘了。例如:根据历史数据预测股票发展趋势等。

关系数据库是数据挖掘的最常见、最丰富的数据资源,因此它是我们数据挖掘的一种主要数据形式。

二、数据仓库

数据仓库是一个从多个数据源收集的信息存储库,存放在一致的模式下,并且通常主流在单个站点上。数据仓库通过数据清理、变换、集成、装入和定期数据刷新来构造。

数据仓库用称作数据立方体的多维数据结构建模。

通过多维数据视图和汇总数据的预计算,数据仓库非常适合做联机分析处理。通过上卷和下钻,用户可以在不同的汇总级别观察数据。例如:可以对按季度汇总的销售数据下钻为按月汇总的数据,反过来则是上卷的过程。

三、事务数据

事务数据库的每一个记录代表一个事务,例如,顾客的一次购物、用户的一次火车订票。

通常一个事务由一个唯一的事务标识ID和一个组成事务的项(如购买的商品)构成的列表。

可以理解为嵌套的关系。

事务数据上的数据挖掘可以通过挖掘频繁项集(频繁的一起销售的商品的集合)来进行购物篮数据分析。

四、其他类型的数据

时间相关或序列数据(时间序列、生物学序列数据等)

数据流(视频监控和传感器数据等)

空间数据(地图等)

文本数据

图像数据

视频、音频数据

图和网状数据(社会和信息网络)

万维网(由Internet提供的巨型信息存储库)

其实,这些数据更接近日常生活,如何对不同类型的数据,挖掘出满足用户意图的知识,是值得亟需深入探讨学习的。

 


参考文献:数据挖掘:概念与技术(原书第三版)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值