03_50年数仓演化史

在这里插入图片描述

架构演化内驱

系统架构是一个产品的基石,它的扎实是产品成长性的保障。但是架构永远与产品是共同成长的。新产品刚推出时,快速、可用即行,不可能构造一个复杂、庞大的基础架构。随着产品的热火,压力越来越大,容量、伸缩性问题就来了。在保证业务的前提下,对架构进行优化、改造就成为必要。

业务数据库

一个企业IT信息化初级绝对,业务库中的数据量并不大,这时候OLTP结构下可以通过SQL语句快速响应读写需求,可能Excel也能满足。

在这里插入图片描述
但是随着时间的推移,各种问题开始出现

  1. 高频的write和长时间的read冲突越来越严重,而数据分析要耗费大量计算资源,不能动不动挂业务系统 ?
  2. 数据量越来越大,历史业务数据,新业务数据激增啦。首当其冲解决业务应用效率问题,谁管数据分析问题 ?

中间库

由于上述问题,就要引入中间库来处理。左图结构解决了高频write和read冲突问题,以及单数据库服务器性能问题,顺手也搞定了数据备份。这种情况下呢简单查询还是可以的,但随着业务越来越多,表结构越来越复杂,业务系统数量越来越多,导致数据孤岛开始形成(不同数据格式、存储方式、不同软件、厂商保护)

在这里插入图片描述
但是这种背景下,要把原来的以单一数据库为中心的数据环境发展为体系化环境。体系化环境由操作型环境(OLTP)和分析型环境(OLAP)包括全局级数据仓库、部门级数据仓库、个人级数据仓库构成。特点:面向主题的,集成的,相对稳定的,反映历史变化的。

数据仓库

有句话说的好:没有分析的数据是成本中心,而不是企业资产,数据仓库是将企业的各业务系统产生的基础数据,根据业务需求,通过维度建模的方式,将业务数据划分为多个主题,统一存储,统一管理

  1. 面向主题:仓库信息时按住一定主题域组织
  2. 集成:集成了多个主题域的单一信息源
  3. 稳定(非实时):几乎没有修改和删除操作,通常只需要定期加载、刷新
  4. 反映历史变化:OLTP系统主要关心当前某一个时间段内的数据,而数仓通常包含历史信息

在这里插入图片描述
数据仓库名词解释
在这里插入图片描述

数据集市

数据集市是一个结构概念,它是企业级数据仓库的一个子集,主要面向部门级业务,并且只面向某个特定的主题,数据集市是数仓之上更聚焦的业务主题合集(DW公司级,DM部门级)

如下图所示的以数据仓库为基础的决策支持环境,要求数据仓库能够满足所有最终用户的需求。然而,最终用户的需求是不断变化的,而且各种类型的用户对信息的需求也不一样,这就要求数据仓库存储的数据具有充分的灵活性,能够适应各类用户的查询和分析。另一方面,最终用户对信息的需求必须易于访问,能够在较高的性能上获得结果。但是,灵活性和性能对数据仓库而言,是一对矛盾体。为了解决灵活性和性能之间的矛盾,数据仓库体系结构中增加了数据集市,数据集市按部门需求对数据进行划分,因此我们说数据集市是为了支撑部门级业务,从而满足个部门对灵活和性能的需求。
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值