数据仓库技术(Data Warehouse Technologien) 第一章节 总览(1)

内容均来自博主所在大学的课程,在此不引用原文,均以翻译和个人理解文本出现。如需要原版幻灯片(德语),请联系博主。这将是一个系列的课程,国内对数据仓库的相关课程以及资料少之又少,即使出现也只是作为数据挖掘的陪衬,特此在这里进行总结以便整理和交流,有任何问题请留言,欢迎提问交流。

课件及书本作者:Prof. Dr.-Ing. Kai-Uwe Sattler, Prof. Dr. Gunter Saake, Dr. Veit Köppen

如今,数据仓库是现代企业级信息系统的重要组成部分,并构成了决策支持系统的基础。 数据仓库的特殊要求:

  1. 要存储的数据量
  2. 数据的多维结构 以及
  3. 对较短响应时间的要求
  4. 需要利用数据库技术进行的特殊支持。

内容概览

  1. 引入和基本定义(术语)- 本章节(1)(2)(3)(4)
  2. 数据仓库架构(1)(2)(3)
  3. 多维数据模型(1)(2)(3)
  4. 提取,转换和加载(1)
  5. 数据仓库中的查询
  6. 存储结构(1)
  7. 索引结构
  8. 查询处理和查询优化
  9. 物化视图(视图实现)
  10. 业务智能应用

使用的书目

Köppen, V.; Saake, G.; Sattler, K.-U.: Data Warehouse Technologien
2. Auflage, mitp-Verlag, 2014, 351 Seiten, 29,99 €

第一章节 引入和基本定义(术语)

1. 场景:饮料市场

单一的市场关于饮料的相关数据(数据来源单一)

2. DB-Schema 数据库模式(层)

关于单一市场的数据库模式

 

3. 数据库使用(应用 - 针对上方单一市场进行相关数据库查询)

  • 查询
  1. 上个月 销售了多少罐 可乐
  2. 去年 红酒 销售趋势 如何?
  3. 谁是我们的顶级用户
  4. 我们从 哪个供应商 那里获得 最多的箱子
  • 问题
  1. 使用外部来源(客户数据库,供应商数据库,... )。
  2. 涉及时间方面的数据。

4. 拓展场景

在A和B两个地方开着许许多多这种市场(超市)

5. 数据库使用2(针对多个市场进行相关数据库查询)

  • 查询
  1. 我们在 A地点的某个城市的超市 卖出的啤酒的量比 B地点的某个城市的超市 多吗?(A.stadt.market.Bier > B.stadt.market.Bier)
  2. 夏季在整个B地点售出多少可乐?
  3. 比饮用水多吗?
  • 问题
  1. 跨更多的数据库的查询。

6. 解决方案

  • 变体1:“分布式数据库”
  1. 跨多数据库的全局查询(请求)→ 带Union的视图。
  2. 缺点:昂贵的分布式查询执行。
  • 变体2:“集中式(中央)数据库”
  1. 在一个中央数据库中更改。
  2. 缺点:操作运行中应答时间长

7. 数据仓库解决方案

所有数据库(同构/异构)数据汇总到数据仓库

8. 课程目标(对象)

  • 数据仓库:搜集数据和支持决策过程的技术。
  • 数据库技术的挑战:
  1. 数据量(有效存储及管理,查询处理);
  2. 数据建模(时间相关,多维度);
  3. 集成异构数据库;
  • 难点/重点
  1. 数据仓库中的数据库技术。

9. 概览

数据仓库系统

 

由于插图和结构图的绘制花费的时间较长,每个章节就拆开慢慢更新

2019.11.29

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值