内容均来自博主所在大学的课程,在此不引用原文,均以翻译和个人理解文本出现。如需要原版幻灯片(德语),请联系博主。这将是一个系列的课程,国内对数据仓库的相关课程以及资料少之又少,即使出现也只是作为数据挖掘的陪衬,特此在这里进行总结以便整理和交流,有任何问题请留言,欢迎提问交流。
课件及书本作者:Prof. Dr.-Ing. Kai-Uwe Sattler, Prof. Dr. Gunter Saake, Dr. Veit Köppen
如今,数据仓库是现代企业级信息系统的重要组成部分,并构成了决策支持系统的基础。 数据仓库的特殊要求:
- 要存储的数据量
- 数据的多维结构 以及
- 对较短响应时间的要求
- 需要利用数据库技术进行的特殊支持。
内容概览
- 引入和基本定义(术语)- 本章节(1)(2)(3)(4)
- 数据仓库架构(1)(2)(3)
- 多维数据模型(1)(2)(3)
- 提取,转换和加载(1)
- 数据仓库中的查询
- 存储结构(1)
- 索引结构
- 查询处理和查询优化
物化视图(视图实现)- 业务智能应用
使用的书目
Köppen, V.; Saake, G.; Sattler, K.-U.: Data Warehouse Technologien
2. Auflage, mitp-Verlag, 2014, 351 Seiten, 29,99 €
第一章节 引入和基本定义(术语)
1. 场景:饮料市场
![](https://i-blog.csdnimg.cn/blog_migrate/715fdd7f220f11c3e7c699e7d423e512.png)
2. DB-Schema 数据库模式(层)
![](https://i-blog.csdnimg.cn/blog_migrate/f9508c5e9f2dab3bdc7ed44b606de95a.png)
3. 数据库使用(应用 - 针对上方单一市场进行相关数据库查询)
- 查询
- 上个月 销售了多少罐 可乐?
- 去年 的 红酒 销售趋势 如何?
- 谁是我们的顶级用户?
- 我们从 哪个供应商 那里获得 最多的箱子?
- 问题
- 使用外部来源(客户数据库,供应商数据库,... )。
- 涉及时间方面的数据。
4. 拓展场景
![](https://i-blog.csdnimg.cn/blog_migrate/892b2be9f0b1e4ede9d1a2e4d1707926.png)
5. 数据库使用2(针对多个市场进行相关数据库查询)
- 查询
- 我们在 A地点的某个城市的超市 卖出的啤酒的量比 B地点的某个城市的超市 多吗?(A.stadt.market.Bier > B.stadt.market.Bier)
- 夏季在整个B地点售出多少可乐?
- 比饮用水多吗?
- 问题
- 跨更多的数据库的查询。
6. 解决方案
- 变体1:“分布式数据库”
- 跨多数据库的全局查询(请求)→ 带Union的视图。
- 缺点:昂贵的分布式查询执行。
- 变体2:“集中式(中央)数据库”
- 在一个中央数据库中更改。
- 缺点:操作运行中应答时间长
7. 数据仓库解决方案
![](https://i-blog.csdnimg.cn/blog_migrate/065ec8bfb5d2bd3998bacd9eae299981.png)
8. 课程目标(对象)
- 数据仓库:搜集数据和支持决策过程的技术。
- 数据库技术的挑战:
- 数据量(有效存储及管理,查询处理);
- 数据建模(时间相关,多维度);
- 集成异构数据库;
- 难点/重点
- 数据仓库中的数据库技术。
9. 概览
![](https://i-blog.csdnimg.cn/blog_migrate/dc1c8a806598e4dfb26407f83ad56169.png)
由于插图和结构图的绘制花费的时间较长,每个章节就拆开慢慢更新
2019.11.29