数据仓库与数据挖掘

讲的都是一些理论,数据仓库,给我感觉就是一个存数据的地方,然后可以查询,分析。

数据挖掘就是从仓库中的数据中发现有价值的内容,比如关联学习规则中的一个例子,啤酒与尿布。一个事件发生可以导致另一个事件发生。

还根据不同的对象,讲了一些数据挖掘的技术,比如空间数据,非结构化数据,非结构化数据就是web数据,各个网站的数据结构都不一样,好像是半结构化数据,需要把这些数据集成起来才好使用,要有一个基本的结构,把网上的数据预处理成这样的结构。

空间类数据,比如天文数据,交通数据,地理数据。跟时空相关。

还有知识数据挖掘,统计类数据挖掘。

数据怎么来呢,可以爬虫,爬虫不太行,别人网站愿意免费把数据给你吗,所以最后可能还是得买数据。

还介绍了一些工具,数据仓库建模,数据仓库管理。

数据仓库有一些数据是休眠数据,这种数据几乎用不着,所以占空间,需要处理。

这本书到底在讲什么。因为这本书是很多人一起写的,不太行。一个人写的话比较有体系。里面有一些内容重复,给我感觉很膈应。

本书是讲数据挖掘和数据仓库,数据挖掘是知识发现的一个关键步骤,书里面好像这么说。

数据仓库是存东西的,数据挖掘是从存的东西里面找规律,总结知识,看有没有用。

仓库当然有他独特的结构,怎么创建仓库,数据挖掘有哪些工具。

数据管理,管理什么?管理数据,有哪些数据,元数据是其中之一,元数据我觉得就是对数据的描述,数据产生在哪里,产生的时间等等。

联机分析处理,联机事务处理,molap,rolap 。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值