分布式数据库 | 集中式数据库 |
---|---|
多个node,多分片 | 单节点,单存储 |
能承担更高的访问压力 | 性能瓶颈 |
离用户最近的node获取数据 | 数据传输可能需要更长时间 |
高可用 | 单点问题 |
必须进行数据同步 | 数据管理简单 |
分布式数据的核心:
数据分片
数据同步
数据分片:
- 水平分片:按行对数据进行分割,分散到不同的节点,表结构一致
- 垂直分片:按列对数据进行分割,把一个表结构拆分成多个小表
数据同步:
它是分布式数据库的底线,数据的一致性需要靠同步来保证。
集中式数据库到分布式数据库的一个过程
MPP(大规模并行处理)类型的数据库
阿里云 PolarDB 的 HTAP 架构
分布式数据库发展就是一个由合到分,再到合的过程:
- 早期的关系型商业数据库的分布式能力可以满足大部分用户的场景,因此产生了如 Oracle 等几种巨无霸数据库产品;
- OLAP 领域首先寻求突破,演化出了大数据技术与 MPP 类型数据库,提供功能更强的数据分析能力;
- 去 IOE 引入数据库中间件,并结合应用平台与开源单机数据库形成新一代解决方案,让商业关系型数据库走下神坛,NoSQL 数据库更进一步打破了关系型数据库唯我独尊的江湖地位;
- 新一代分布式 OLTP 数据库正式完成了分布式领域对数据库核心特性的完整支持,它代表了分布式数据库从此走向了成熟,也表明了 OLAP 与 OLTP 分布式场景下,分别在各自领域内取得了胜利;
- HTAP 和多模式数据处理的引入,再一次将 OLAP 与 OLTP 融合,从而将分布式数据库推向如传统商业关系型数据库数十年前那般的盛况,而其产生的影响要比后者更为深远。