OLAP与OLTP的区别（详解）

五块兰州拉面

已于 2023-03-30 10:09:40 修改

阅读量688

点赞数

分类专栏：阅读文章标签：数据库数据仓库

于 2023-03-16 14:55:39 首次发布

本文链接：https://blog.csdn.net/qq_39331255/article/details/129579347

版权

阅读专栏收录该内容

9 篇文章 0 订阅

订阅专栏

整理不易，转发请注明出处，请勿直接剽窃！
点赞、关注、不迷路！

摘要： OLTP、OLAP，数仓建模

现代工程界普遍认为，数据库系统可以在广义上分为联机事务处理（Online Transaction Process，OLTP）和联机分析处理（Online Analyze Process，OLAP）两种面向不同领域的数据库，OLAP数据库也被称为数据仓库。

制作者五块兰州拉面	OLAP	OLTP
用途	数据仓库	事务数据库
数据容量	大，PB级	小，GB级
事务能力	弱或无	强
数据模型	星型、雪花、星座型	实体-关系模型（ER）
建模方式	维度建模	范式建模
建模特点	从业务出发开发快	全面梳理业务和数据、周期长、难度高
数据库举例	Hive、HBase、ClickHouse	MySQL、PostgreSQL、Oracle
数据时效	当前和历史数据	当前数据
数据操作	不支持修改、删除	增删改查
分析能力	强	弱
操作粒度	多表	记录级
并发数	低	高
性能要求	性能要求较低	高吞吐量、低延时
数据质量	相对低	高
数据来源	各业务数据库	各业务系统
业务类型	多维分析、统计报告	账户查询、转账等
业务目标	数据存储、质量提升	事务处理的并发、安全、高效

三范式详解
 维度建模

范式建模

OLTP数据库在进行数据库设计时使用实体-关系模型（Entity-Relationship Model，E-R Model，简称ER模型）。在ER模型的建模过程中有一个非常重要的规范化过程。规范化的目的在于通过一系列手段使得数据库设计符合数据规范化（Normal Form，NF）的原则。
规范化是将数据表从低范式变成高范式的过程。

范式建模意义

一般要求在设计业务数据表时，需要至少设计到第三范式，避免出现数据冗余。冗余不仅增加了数据大小，更重要的是，冗余的存在会影响数据库事务，降低数据库事务性能。
表1-6展示了一个不合格的表设计，请读者关注最后两列，很明显这是不满足第三范式的一种设计。表中的最后一列“需要权限”用于设置数据权限，表格中的数据意味着第一行和第三行需要admin权限才能查看。正常情况下没有问题，如果随着业务的变化，需要将授权级别为“2 – 非公开”的权限改为admin和manager都有权限查看。对于这种需求，就需要进行全表扫描，将数据表中所有的授权级别为2的数据全部进行修改，这会严重降低数据库性能。
在这里插入图片描述 数据库规范化的意义在于通过规范化降低冗余，提高数据库事务性能。正是基于这个考虑，在数据库表设计中，会要求将对数据表进行规范化。

范式建模的局限

规范化的数据表能够降低冗余，进而提高事务性能。同时，规范化的数据表无法支撑分析。
统计分析时，单张表无法完成操作，需要多表进行连接（join）操作，得到的新表才能用于分析。而在绝大多数数据库系统中，join操作的过程相对于查询来说比较慢。

数仓建模本质

高范式的表适合事务处理，而低范式的表适合分析处理。从中我们可以得出数仓建模的本质：逆规范化（反范式）。数仓建模本质上就是一个逆规范化的过程，将来自原始业务数据库的规范化数据还原为低范式的过程，从而用于快速分析。
在实际建模过程中，数仓经常提到的宽表本质上就是一个低范式的表。宽表将所有相关联的列全部都整合到一张表中，用于未来的分析，这样做的好处就是所有相关信息都在这张宽表中，理论上在进行分析时就不需要进行任何join操作了，因为可以直接进行相关的分析，所以提高了分析速度。这样做的缺点就是数据冗余，从而难以支持事务能力。
大部分数据仓库都是基于低范式数据集进行优化的，读者在使用OLAP引擎时一定要时刻记住这一点，避免将OLTP数据库中的原始高范式数据直接用于OLAP分析，否则分析效果可能会差强人意。而应该通过逆规范化的过程将高范式数据集还原为低范式数据集，再由OLAP进行分析。

数据仓库整体架构梳理