总述:这部分主要介绍数据挖掘的实现问题,重点关注数据的组织形式、系统框架、相关的设计和名词介绍。不会涉及到非常具体的应用项目,可以当做基础知识科普。
- 什么是数据仓库
- 联机事务处理系统(OLTP)和联机分析处理系统(OLAP)的区别有哪些
- 多维数据模型的建立
- 如何设计和构造数据仓库
- 三层数据仓库结构的案例
- 数据仓库后端工具应该提供的能力要在什么范围内
- 元数据存储库是什么
- OLAP服务器类型有哪些
- 数据仓库实现中的问题
- 数据仓库、OLAP、OLAM(OLAP挖掘)的关系
1.什么是数据仓库
答:数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。
2.联机事务处理系统(OLTP)和联机分析处理系统(OLAP)的区别有哪些
答:OLTP是面向顾客的,关注企业或部门内部当前数据,采用实体-联系数据模型和面向应用的数据库设计,强调并发控制和恢复机制;OLAP是面向市场的,关注的数据来自不同数据库的不同版本,数据量巨大,采用星形或雪花模型和面向主题的数据库设计,大部分是只读操作。
OLTP和OLAP最好不要共用数据库,因为OLTP强调事务处理面向业务,OLAP强调大数据量查询汇总面向市场,两者共享会互相降低对方的使用体验。
3.多维数据模型的建立
答:数据立方体运维从多维对数据建模和观察,由维和事实定义。一般来说,维是关于一个组织想要保存记录的透视图或实体。每个