数据库分库分表

最新推荐文章于 2023-05-16 00:36:21 发布

breezegk

最新推荐文章于 2023-05-16 00:36:21 发布

阅读量611

点赞数

转载 https://mparticle.uc.cn/article.html?uc_param_str=frdnsnpfvecpntnwprdssskt&btifl=100&app=uc-iflow&title_type=1&wm_id=54078d561061420ba3a3958070d8e1cd&wm_cid=288796857105910784&pagetype=share&client=&uc_share_depth=1&action=follow&action_from=content

这里总结了分库分表的相关概念、全局ID的生成策略、分片策略、平滑扩容方案及流行的方案。

一、分库分表概述

在业务量不大时，单库单表即可支撑。当数据量过大存储不下、或者并发量过大负荷不起时，就要考虑分库分表。

1、分库分表相关术语

· 读写分离：不同的数据库，同步相同的数据，分别只负责数据的读和写；

· 分区：指定分区列表达式，把记录拆分到不同的区域中（必须是同一服务器，可以是不同硬盘），应用看来还是同一张表，没有变化；

· 分库：一个系统的多张数据表，存储到多个数据库实例中；

· 分表：对于一张多行（记录）多列（字段）的二维数据表，又分两种情形：

①垂直分表：竖向切分，不同分表存储不同的字段，可以把不常用或者大容量、或者不同业务的字段拆分出去；

②水平分表（最复杂）：横向切分，按照特定分片算法，不同分表存储不同的记录。

2、真的要采用分库分表？

需要注意的是，分库分表会为数据库维护和业务逻辑带来一系列复杂性和性能损耗，除非预估的业务量大到万不得已，切莫过度设计、过早优化。

规划期内的数据量和性能问题，尝试能否用下列方式解决：

· 当前数据量：如果没有达到几百万，通常无需分库分表；

· 数据量问题：增加磁盘、增加分库（不同的业务功能表，整表拆分至不同的数据库）；

· 性能问题：升级CPU/内存、读写分离、优化数据库系统配置、优化数据表/索引、优化SQL、分区、数据表的垂直切分；

如果仍未能奏效，才考虑最复杂的方案：数据表的水平切分。

二、全局ID生成策略

1、自动增长列

· 优点：数据库自带功能，有序，性能佳。

· 缺点：单库单表无妨，分库分表时如果没有规划，ID可能重复。

解决方案：

设置自增偏移和步长：

##假设总共有10个分表

##级别可选：SESSION（会话级），GLOBAL（全局）

SET@@SESSION.auto_increment_offset=1;##起始值，分别取值为1~10

SET@@SESSION.auto_increment_increment=10;##步长增量

如果采用该方案，在扩容时需要迁移已有数据至新的所属分片。

全局ID映射表：

在全局Redis中为每张数据表创建一个ID的键，记录该表当前最大ID；每次申请ID时，都自增1并返回给应用；Redis要定期持久至全局数据库。

2、UUID（128位）

在一台机器上生成的数字，它保证对在同一时空中的所有机器都是唯一的。通常平台会提供生成UUID的API。

UUID由4个连字号（-）将32个字节长的字符串分隔后生成的字符串，总共36个字节长。形如：550e8400-e29b-41d4-a716-446655440000。

UUID的计算因子包括：以太网卡地址、纳秒级时间、芯片ID码和许多可能的数字。UUID是个标准，其实现有几种，最常用的是微软的GUID（GlobalsUniqueIdentifiers）。

· 优点：简单，全球唯一。

· 缺点：存储和传输空间大，无序，性能欠佳。

3、COMB（组合）

组合GUID（10字节）和时间（6字节），达到有序的效果，提高索引性能。

4、Snowflake（雪花）算法

Snowflake是Twitter开源的分布式ID生成算法，其结果为long（64bit）的数值。其特性是各节点无需协调、按时间大致有序、且整个集群各节点单不重复。

该数值的默认组成如下（符号位之外的三部分允许个性化调整）

打开UC浏览器查看更多精彩图片

· 1bit：符号位，总是0（为了保证数值是正数）；

· 41bit：毫秒数（可用69年）；

· 10bit：节点ID（5bit数据中心+5bit节点ID，支持32*32=1024个节点）；

· 12bit：流水号（每个节点每毫秒内支持4096个ID，相当于409万的QPS，相同时间内如ID遇翻转，则等待至下一毫秒）。

三、分片策略

1、连续分片

根据特定字段（比如用户ID、订单时间）的范围，值在该区间的，划分到特定节点。

· 优点：集群扩容后，指定新的范围落在新节点即可，无需进行数据迁移。

· 缺点：如果按时间划分，数据热点分布不均（历史数冷当前数据热），导致节点负荷不均。

2、ID取模分片

· 缺点：扩容后需要迁移数据。

3、一致性Hash算法

· 优点：扩容后无需迁移数据。

4、Snowflake分片

· 优点：扩容后无需迁移数据。

四、分库分表引入的问题

1、分布式事务

由于两阶段/三阶段提交对性能损耗大，可改用事务补偿机制。

2、跨节点JOIN

对于单库JOIN，MySQL原生就支持；对于多库，出于性能考虑，不建议使用MySQL自带的JOIN，可以用以下方案避免跨节点JOIN：

· 全局表：一些稳定的共用数据表，在各个数据库中都保存一份；

· 字段冗余：一些常用的共用字段，在各个数据表中都保存一份；

· 应用组装：应用获取数据后再组装；

· 另外：某个ID的用户信息在哪个节点，他的关联数据（比如订单）也在哪个节点，可以避免分布式查询。

3、跨节点聚合

只能在应用程序端完成。但对于分页查询，每次大量聚合后再分页，性能欠佳。

4、节点扩容

节点扩容后，新的分片规则导致数据所属分片有变，因而需要迁移数据。

五、节点扩容方案

1、常规方案

如果增加的节点数和扩容操作没有规划，那么绝大部分数据所属的分片都有变化，需要在分片间迁移：

· 预估迁移耗时，发布停服公告；

· 停服（用户无法使用服务），使用事先准备的迁移脚本，进行数据迁移；

· 修改为新的分片规则；

· 启动服务器。

2、免迁移扩容

采用双倍扩容策略，避免数据迁移。扩容前每个节点的数据，有一半要迁移至一个新增节点中，对应关系比较简单。

具体操作如下（假设已有2个节点A/B，要双倍扩容至A/A2/B/B2这4个节点）：

· 无需停止应用服务器；

· 新增两个数据库A2/B2作为从库，设置主从同步关系为：A=>A2、B=>B2，直至主从数据同步完毕（早期数据可手工同步）；

· 调整分片规则并使之生效：

原ID%2=0=>A改为ID%4=0=>A，ID%4=2=>A2；

原ID%2=1=>B改为ID%4=1=>B，ID%4=3=>B2。

· 解除数据库实例的主从同步关系，并使之生效；

· 此时，四个节点的数据都已完整，只是有冗余（多存了和自己配对的节点的那部分数据），择机清除即可（过后随时进行，不影响业务）。

六、分库分表方案

1、代理层方式

部署一台代理服务器伪装成MySQL服务器，代理服务器负责与真实MySQL节点的对接，应用程序只和代理服务器对接。对应用程序是透明的。比如MyCAT，官网，源码。

· MyCAT后端可以支持MySQL、SQLServer、Oracle、DB2、PostgreSQL等主流数据库，也支持MongoDB这种新型NoSQL方式的存储，未来还会支持更多类型的存储。

· MyCAT不仅仅可以用作读写分离，以及分表分库、容灾管理，而且可以用于多租户应用开发、云平台基础设施，让你的架构具备很强的适应性和灵活性。

2、应用层方式

处于业务层和JDBC层中间，是以JAR包方式提供给应用调用，对代码有侵入性。

主要方案有：

· 淘宝网的TDDL：已于2012年关闭了维护通道，建议不要使用；

· 当当网的Sharding-JDBC：仍在活跃维护中：当当应用框架ddframe中，从关系型数据库模块dd-rdb中分离出来的数据库水平分片框架，实现透明化数据库分库分表访问，实现了Snowflake分片算法。

Sharding-JDBC定位为轻量Java框架，使用客户端直连数据库，无需额外部署，无其他依赖，DBA也无需改变原有的运维方式。Sharding-JDBC分片策略灵活，可支持等号、between、in等多维度分片，也可支持多分片键。

SQL解析功能完善，支持聚合、分组、排序、limit、or等查询，并支持BindingTable以及笛卡尔积表查询。

Sharding-JDBC直接封装JDBC API，可以理解为增强版的JDBC驱动，旧代码迁移成本几乎为零：

· 可适用于任何基于Java的ORM框架，如JPA、Hibernate、Mybatis、SpringJDBC Template或直接使用JDBC。

· 可基于任何第三方的数据库连接池，如DBCP、C3P0、BoneCP、Druid等。

· 理论上可支持任意实现JDBC规范的数据库。虽然目前仅支持MySQL，但已有支持Oracle、SQLServer等数据库的计划。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据库分库分表

转载https://mparticle.uc.cn/article.html?uc_param_str=frdnsnpfvecpntnwprdssskt&btifl=100&app=uc-iflow&title_type=1&wm_id=54078d561061420ba3a3958070d8e1cd&wm_cid=288796857105910784&a...
复制链接

扫一扫

breezegk CSDN认证博客专家 CSDN认证企业博客

码龄16年

13: 原创

27万+: 周排名

17万+: 总排名

4万+: 访问

: 等级

474: 积分

8: 粉丝

4: 获赞

13: 评论

31: 收藏

私信

关注

热门文章

分类专栏

最新评论

windows 电脑改成安卓桌面（触摸屏，平板模式）
breezegk: 过几天我再优化一下发个下载链接出来
windows 电脑改成安卓桌面（触摸屏，平板模式）
helix2020: 你好，你这个挺好的，这个软件叫什么名字啊，在哪下载呢，方便告知一下吗？
windows 电脑改成安卓桌面（触摸屏，平板模式）
CSDN-Ada助手: 恭喜你写了第16篇博客！标题很吸引人，我也很期待能够在你的博客中了解如何将Windows电脑改成安卓桌面。你的持续创作让读者们有了更多有趣的内容可以阅读，希望你能继续坚持下去。在下一步的创作中，或许你可以分享一些具体的步骤和技巧，帮助读者更好地实现这一改变。谢谢你的努力与分享！
摄像头互动游戏-抓飞机&躲炸弹
breezegk 回复 afei1230123: 你好，可以加我qq:3230209537
摄像头互动游戏-抓飞机&躲炸弹
afei1230123: 大神，留个联系方式，我最近有这方面的需求，咱们可以合作一下

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。