数据仓库是一个面向主题的,集成的,不可更新的,随时间变化的数据集合,它用于支持企业,或组织的决策分析处理。
主题:用户使用数据仓库,进行决策时,所关心的重点方面,比如,商品的推荐系统,商品的推荐系统,也是基于数据仓库所做出来的系统,那么我们关心的主题,是我们商品的信息。
这是数据仓库的第一层含义
集成:数据仓库中的数据,来源于埋点产生的数据,Java后台的数据,爬虫数据,mysql中的数据,文本文件(csv),把不同的数据集成起来。
这是数据仓库中的第二层含义
不可更新的:数据仓库是为了进行决策分析所提供的数据,所涉及到的操作主要是用于数据的查询。我们一般不会在数据仓库中做更新和删除操作。因为,数据仓库就是做查询操作。
数据存储和管理(数据仓库)
ETL:(数仓核心)
e:extract:抽取
t:tranform:转换
l:Load:加载
数据仓库的引擎:
1,查询操作(服务一)
2,报表操作(服务二)
3,决策分析(服务三)
4,其他业务(服务四)
前端展示
1,数据查询
2,数据报表
3,决策支持
4,其他系统
OLTP :联机事务处理,所关心的是事务的成功或者是失败,只有成功和失败,无其他情况,比如,银行转账。
OLAP:联机分析处理,主要用来用于查询。