分库分表 - 数据库分片（sharding）研究（一）

最新推荐文章于 2024-11-02 22:43:12 发布

原创最新推荐文章于 2024-11-02 22:43:12 发布 · 689 阅读

CC 4.0 BY-SA版权

文章标签：

2 篇文章

订阅专栏

本文深入探讨数据库分片的必要性，涵盖垂直分区与水平分片的区别，Microsoft Azure SQL的分片架构，以及实际应用中要考虑的备份、恢复、连接管理和事务一致性等问题。通过实例和最佳实践，揭示了分片技术在现代IT架构中的关键作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

什么要分片

分片是一项可跨许多独立数据库、分发大量相同结构数据的技术。需要分片的原因有很多：

垂直分区 - 跨数据库查询：数据在数据层中的多个数据库之间垂直分区。通常，不同的表集驻留在不同的数据库上。这意味着不同数据库上的架构是不同的。例如，清单的所有表都位于一个数据库上，而与会计相关的所有表都位于第二个数据库上。采用此拓扑的常见使用案例需要使用一个查询跨多个数据库中的表进行查询或编译报表。

垂直分区 - 使用弹性查询来查询引用数据

水平分区 - 使用弹性查询实现分片数据层上的报告

水分区和垂直分区的对比 （以下摘自网图）

下图摘取自 Microsoft 的产品文档，显示了一种体系结构，它包含与数据库集合有关的弹性数据库功能。

弹性数据库工具

在此图中，数据库颜色表示架构。颜色相同的数据库具有相同的架构。

关于数据库的分片架构有很多，上面的 Microsoft Azure SQL 只是其中的一种设计。不过从这个设计中，我们可以看到数据库分片需要考虑以下方面：

由多个DB构成的 Data Tier ，用于数据的存储和处理
Client 端的 library，需要考虑如何进行客户端的改造，尽可能减少对客户端的影响
跨 Sharded 的查询，Microsoft 称之为 Elastic Database Query DB。虽然我们需要对分区的键进行优化设计，但也不可避免的会产生跨 Sharded的查询
Sharded 的管理，如拆分、合并、数据迁移等。可以由专门的工具，也可以只考虑方案。
Database Jobs 的执行
事务

考虑到一些实际情况，延申的问题还有：