数据仓库的诞生主要有两个原因:
- 历史数据的积存需要
- 企业数据分析的需要
历史数据积存
对于企业来说,线上的业务系统,随着业务的进行,会源源不断的产生数据。这些数据都会存储在业务数据库中,如 MySQL、Oracle 当中,支持业务系统的运行。
但当线上的业务系统运行超过一定时间,其积压的历史数据就会越来越多,对业务数据库就会产生一定的负载,导致业务系统运行速度降低。
而这些历史数据中,有相当一部分是冷数据。但业务系统一般对最近产生的数据(当天、一周内、一个月内)调用比较频繁,对较早之前的数据调用频率很低。
所以为了避免随着时间的推移,历史数据积压对业务数据库产生的影响,从而影响业务的正常运行,企业需要定期将积压的历史数据从业务数据库中转移出去,存储到一个专门存放历史数据的仓库中。这就是数据仓库。
业务数据库存储的高频热数据支持线上业务的运行,如果调用到历史数据,再从数据仓库中进行操作。
企业数据分析的需要
企业将历史数据存储到数据仓库中后,这些数据不仅可以改善业务数据库的性能;还可以用来进行数据分析,