数据优化——分库分表（四）高级策略

CabbageDevil

已于 2022-05-20 11:08:47 修改

阅读量692

点赞数

分类专栏： Spring 分库分表架构文章标签：中间件数据库 java

于 2022-05-18 20:47:28 首次发布

本文链接：https://blog.csdn.net/bcdmw233/article/details/124837053

版权

架构同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

Spring

9 篇文章 0 订阅

订阅专栏

分库分表

3 篇文章 0 订阅

订阅专栏

数据优化——分库分表（一）概念及运用场景-详解
 数据优化——分库分表（二）策略讲解
 数据优化——分库分表（三）中间件讲解

1 什么是高级策略

在数据优化——分库分表（二）策略讲解中我们已经讲解了一些基础的策略去实行分库分表。虽然他们是可行的，但是也蕴藏着一些问题。而在基础略之上可以解决此类问题的，我称呼为高级策略，那我们先来总结一下问题所在。

数据是源能源不断的，所以数据库需要扩容，而基础策略扩容难
多维度查询难。如聚合查询，条件查询等。

2 扩容问题

如果是按照基础策略，我们扩容的时候需要数据迁移，虽然我们设计基础策略的时候取模可以让迁移的成本降低，但是这个数据迁移的过程会影响到业务，我们需要的是程序不下线的动态扩容。

缺点：

不能动态扩容
如果提前预建库表，第一提高了项目的建立预算，第二如果达不到预估量浪费资源

2.1 在路由key中添加库表位

我们以订单号举例
在这里插入图片描述

通过添加库位和表位来路由的方式，这样就可以动态扩容了。当然，我们简单的做可以把库位表位添加在头尾，这样方便我们获取，但是为了防止别人知道我们的规则，我们也可以藏在订单号中。

例如： 我现有的库位A/B，表位0/1/2,那我就有6个表，单表1000W就可以容纳6000W的数据，现在我数据量到了1E。我们可以添加C/D两个库位来提升到1.2E的数据容纳量，也可以通过添加表位3/4/5,来满足需要。这样我们就实现了动态的扩容。

当然了，还有一些免迁移的动态扩容设计方式，就是我们之前说过的range策略 ，但是这种策略也有一定的问题，我们在数据优化——分库分表（二）策略讲解也提到过，所以需要选择符合自己业务的策略。

2.2 库表位带来的问题（面试题）

添加库表后还是会带来问题，因为我们的数据没有经过迁移，旧的库表基本接近饱和，而新建的库表则空虚，如果还是按之前的随机方式方式肯定不行的。

对策：
我们可以效仿Nginx给数据库做加权，也就是weight 权重配置。当然weight 的方式有很多

库表位可以使用对象形式，配置权重，避免数据倾斜、数据集中（普通）
编写算法，根据不同的，配置权重，不同的库表位配置不同的权重（复杂）
配置库表为的时候我们可能是以配置项的方式配置，在配置的时候多写几个重复值，增加难度，比如{A,B,C,C,D,D,D}这样我们随机到C和D的概率肯定会大于A和B（简单快捷）

3 查询问题

我们还是以订单为例，我们要查询订单的时候，用户是可以通过库表位+自己的ID定位到指定的库表，哪怕是列表查询，也是不需要全库表联查的，这样提高了效率。但是我们以商家的维度查询订单的时候是没有这些条件的，只能全库表联查，那就发生了分库分表很常见的join问题。这样大大降低了性能效率。
这个也是行业内分库分表的痛点，除了我们说的电商行业还有很多行业也有类似痛点

比如：