上篇文章中,我们提到数据从生产系统生产之后,这些数据会被存储到数据仓库中,不同的生产系统产生不同的数据,他们会被分类存储到数据仓库中。
比如生产系统:客户 这个系统生产的数据会被存储到客户分类下的数据仓库中
比如生产系统:商品 这个系统生产的数据会被存储到商品分类下的数据仓库中
比如生产系统:订单交易 这个系统生产的数据会被存储到订单交易分类下的数据仓库中
比如生产系统:供应链 这个系统生产的数据会被存储到供应链分类下的数据仓库中
比如生产系统:仓配 这个系统生产的数据会被存储到仓配分类下的数据仓库中
生产系统的数据源-------存储到分类的数据仓库下。
数据仓库
数据仓库是什么?
数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。
数据仓库的特点
- 面向主题:数据仓库都是基于某个明确主题,仅需要与该主题相关的数据,其他的无关细节的数据将会被剔除掉
- 集成的:从不的数据源采集数据到同一个数据源
- 随时间变化:关键数据隐式或显示的基于时间变化
- 不可更新的:数据仓库的数据是不可更新的,数据装入后一般只进行查询操作,没有传统数据库的增删改查
数据库和数据仓库的区别
- 数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Amazon Redshift, Hiv