数据挖掘—— 数据仓库和数据挖掘的OLAP技术

数据仓库后端工具主要指的是用来装入和刷新数据的工具,包括:
数据提取:从多个外部的异构数据源收集数据
数据清理:检测数据中的错误并作可能的订正
数据变换:将数据由历史或主机的格式转换为数据仓库的格式
装载、排序、汇总、合并、计算视图,检查完整性。
并建立索引和分区
刷新 将数据源的更新传播到数据仓库中

数据仓库只需要两种数据访问:
数据的初始装载
数据访问

传统的异构数据库集成在多个异构数据库上建立包装程序和中介程序

度量可以根据其所用的聚集函数分为三类:
分布的:将函数用于n个聚集值得到的结果和将函数用于所有数据得到的结果一样

数据仓库的时间范围比操作数据库系统要长的多

最流行的数据仓库概念模型是多维数据模型

DBMS是为OLTP设计的,数据仓库是为OLAP设计的

数据仓库的使用:
增加客户的聚焦
寻找获利点
产品重定位
客户关系管理

多维数据模型(数据立方体)使得从不同的角度对数据进行观察成为可能,而概念分层提供了从不同层次观察数据

典型的数据仓库设计过程:
选取带建模的商务过程
选取商务过程的颗粒度
选取用于每个事实表记录的维
选取安放在事实表中的度量

上卷通过一个维的概念分层向上攀升或者通过维规约

许多概念分层的定义隐含在数据库的模式中

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

饼干饼干圆又圆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值