目录
数据仓库是怎么产生的
Q:我们都知道,每个应用都有自己的数据库,将数据存到数据库中,如果要分析数据的话,为什么不能直接从数据库中调取数据来进行分析呢?
A:On-Line Transaction Processing联机事务处理过程(OLTP)是面向业务的,由前台、应用、数据库共同完成,可以即时地处理输入的数据,及时地回答。但不适合在OLTP的环境中去从数据库中读取数据来进行分析,对于操作库而言,读的压力大于写的压力,并且会挤占数据库对于业务的处理,在OLTP环境下,数据库只存储数周或数月的新数据,不能存储太旧的数据,所以这样也不利于进行数据分析,所以为了既满足数据的分析,又不影响业务,所以出现了数据仓库。
给数据仓库下定义
数据仓库是一个用于存储,分析,报告的数据系统,构建面向分析的集成化数据环境,分析的结果为企业提供决策支持,数据仓库本身不生产任何数据,数据来源于不同的外部系统,同时数据仓库也不需要消费任何数据,其结果开放给各个外部应用使用。我们把这种面向分析,支持分析的系统称之为OLAP(联机分析处理),数据仓库是OLAP系统的一种实现。
数据仓库的特点
- 面向主题
- 集成性
- 非易失性
- 时变性
理解结构化
Q:在操作数据仓库时,使用的是SQL结构化查询语言,那么结构化查询语言中的结构化是什么意思?
A:结构化查询语言查询突出查询的数据是结构化数据,结构化数据与非结构化数据相对,结构化数据特指由二维表结构来逻辑表达和实现的数据,通过关系型数据库进行存储和管理,非结构化数据有XML,HTML等等,本质是不同文件内的数据格式不同。