数仓概念
⚫ 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
⚫ 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。
数仓专注分析
⚫ 数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统;
⚫ 同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用;
⚫ 这也是为什么叫“仓库”,而不叫“工厂”的原因。
数据仓库为何而来,解决什么问题的?
先下结论:为了分析数据而来,分析结果给企业决策提供支撑。
下面以中国人寿保险公司(chinalife)发展为例,阐述数据仓库为何而来?
(1)业务数据的存储问题
⚫ 中国人寿保险(集团)公司下辖多条业务线,包括:人寿险、财险、车险,养老险等。各业务线的业务正常运营需
要记录维护包括客户、保单、收付费、核保、理赔等信息。这么多业务数据存储在哪里呢?
⚫ 联机事务处理系统(OLTP)正好可以满足上述业务需求开展, 其主要任务是执行联机事务处理。其基本特征是前台
接收的用户数据可以立即传送到后台进行处理,并在很短的时间内给出处理结果。
关系型数据库(RDBMS)是OLTP典型应用,比如:Oracle、MySQL、SQL Server等。