数据库
(1)数据库面向事务设计,属于OLTP(在线事务处理)系统,主要操作是随机读/写;
(2)在设计时尽量避免冗余,常采用符合范式规范来设计,范式分为第一范式、第二范式、第三范式,一般要求符合第三范式(较为符合人的逻辑思维);
(3)数据库一般存储业务数据,为捕获数据而设计;
数据仓库
数据仓库Datawarehouse(可简写为DW)是在数据库已经大量存在的情况下,它是一整套包括了ETL、调度、建模在内的完整的理论体系。
(1)ETL ( Extract-Transform-Load)
ETL是将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程;用户从数据源抽取出所需的数据,经过