RD 面试小技巧之DB篇（分布式）

纽约码农

已于 2023-10-30 17:17:05 修改

阅读量93

点赞数

文章标签：面试数据库分布式

于 2023-10-30 15:00:45 首次发布

本文链接：https://blog.csdn.net/weixin_55413092/article/details/134119599

版权

本文介绍了分库分表在解决数据库容量和性能问题上的策略，包括垂直拆分（按业务分类）和水平拆分（数据分布在不同库表），以及如何处理一致性问题，特别是通过分布式事务框架如TCC、SAGA和BASE。还讨论了数据迁移的方法和技术工具ShardingSphere在其中的作用。

摘要由CSDN通过智能技术生成

分库分表

指导原则：扩展立方体
- x-axis：建集群（水平；最简单，整体扩展）<== 全部数据
- y-axis：业务拆分（垂直；按需，子系统的扩展）<== 业务分类数据
- z-axis：数据分片（拆分数据；同类数据，不同扩展方式）<== 任意数据

JAVA 框架层：TDDL，Apache ShardingShpere-JDBC
中间件层：处于业务系统和数据库中间，模拟数据库。
- ShardingSphere：一套开源的分布式数据库中间件解决方案组成的生态圈，提供标准化的数据分片、分布式事务、数据库治理；含3款产品：JDBC, Proxy, Sidecar。
引入成本比较：框架 < 中间件 < 分布式数据库/数据网格

solution：分布式事务
- 一致性要求：在分布式条件下，多个结点的整体事务一致性。
- 场景要求一：严格的一致性————solution：数据库支持XA协议。
- 场景要求二：准实时/非实时的处理————solution：不用事务 or 使用柔性事务框架。
solution 1：XA 分布式事务
- 一致性要求：强一致性
- 需要数据库对 XA 事务的支持。
- 模型
  - AP, Application Program：由应用程序发起事务。
  - RM, Resource Manager：多个，管理具体资源（如数据库）。
  - TM, Transaction Manager：事务管理器；通知资源，控制协调本地事务提交/回滚。
- JAVA 中的分布式事务框架：Atomikos, JBOSS Naratana, Seata（支持 TCC / AT）.
- 问题
  - 同步阻塞问题
  - 单点故障
  - 数据不一致
solution 2：BASE 柔性事务（Basically Avaiable, Soft State, Eventually Consistent）
- 一致性要求：最终一致性
- 适合场景：长事务 & 高并发
- 模式
  - TCC / SAGA：手动补偿。TCC 模式三段逻辑都是独立的事务（准备操作 Try，确认操作 Commit，取消操作 Cancel）；SAGA 无 Try 阶段，直接提交事务。
  - AT：自动补偿；两阶段提交。
事务的发展：本地事务 -> XA（二阶段）强一致性事务 -> BASE 最终一致性事务

方式一：全量
- 优：简单
- 缺：停机时间随数据量上升，对业务影响较大
方式二：全量 + 增量（所有库表都有时间戳及状态字段）
- 优：停机时间较短
- 缺：数据库主库的读压力
方式三：全量 + 增量 + binlog
- 需要中间件支持：模拟从库，订阅读取 binlog，拿到数据，写入集群
  - 历史数据：历史 binlog，全量
  - 实时增量数据：主库正在执行的，增量
- 优：无需额外寻找增量的时间点，无需去主库读数据；平滑迁移，新老数据库可并行使用；可实现多线程断点续传，并发数据同步；可实现自定义复杂异构数据结构；可实现自动扩缩容。
中间件工具：ShardingSphere-Scaling（模拟MySQL从库）
- 支持数据全量和增量同步
- 支持断点续传和多线程数据同步
- 支持数据库异构复制和动态扩容
- 可视化配置

关注