Mysql分库分表的计算公式

怎么就重名了

已于 2023-10-22 11:21:06 修改

阅读量1k

点赞数

分类专栏： mysql 文章标签： mysql 哈希算法数据库

于 2022-01-22 00:19:56 首次发布

本文链接：https://blog.csdn.net/xiaolixi199311/article/details/122631788

版权

mysql 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一直在说mysql数据大了要分库分表，但是一直都不知道分库分表如何计算表和库。

作用

分表：降低单个表数据量太大带来性能的损失
分库：降低单个数据库机器带来性能的损失
分库分表：多个机器、多个表实现性能的提升

常用公式

前提是库数量 * 每个库的表数量的总数不变

midValue = hash(分库分表的值，例如订单ID) % (库数量 * 每个库的表数量)
库序号 = midValue / 每个库的表数量
表序号 = midValue % 每个库的表数量

那为什么要这么分呢？这样分有什么好处呢？

从数学上看，

首先hash(分库分表的值，例如订单ID) % (库数量 * 每个库的表数量)把分库分表的键通过取模的方式映射到范围[0, 库数量 * 每个库的表数量)。
观察midValue = [0, 库数量 * 每个库的表数量)，我们可以得出
midValue / 每个库的表数量的范围就是[0, 库数量)
midValue % 每个库的表数量的范围就是[0, 每个库的表数量)

简单计算

package com.tom.tom.mysql;

import java.util.function.Function;
import java.util.function.UnaryOperator;

public class MysqlDBTable {
    public static void main(String[] args) {
        UnaryOperator<Integer> myHash = UnaryOperator.identity();
        System.out.println("现在1个库，每个库256张表");
        int dbNum = 1;
        int tableNumInDb = 256;

        int orderId = 1000;
        System.out.println(orderId + " db    index: " + getDbIndex(myHash, orderId, dbNum, tableNumInDb));
        System.out.println(orderId + " table index: " + getTableIndex(myHash, orderId, dbNum, tableNumInDb));
        orderId = 1100;
        System.out.println(orderId + " db    index: " + getDbIndex(myHash, orderId, dbNum, tableNumInDb));
        System.out.println(orderId + " table index: " + getTableIndex(myHash, orderId, dbNum, tableNumInDb));
        orderId = 128 + 256 * 23;
        System.out.println(orderId + " db    index: " + getDbIndex(myHash, orderId, dbNum, tableNumInDb));
        System.out.println(orderId + " table index: " + getTableIndex(myHash, orderId, dbNum, tableNumInDb));

        System.out.println("现在变成两个库，每个库128张表");
        dbNum = 2;
        tableNumInDb = 128;
        orderId = 1000;
        System.out.println(orderId + " db    index: " + getDbIndex(myHash, orderId, dbNum, tableNumInDb));
        System.out.println(orderId + " table index: " + getTableIndex(myHash, orderId, dbNum, tableNumInDb));
        orderId = 1100;
        System.out.println(orderId + " db    index: " + getDbIndex(myHash, orderId, dbNum, tableNumInDb));
        System.out.println(orderId + " table index: " + getTableIndex(myHash, orderId, dbNum, tableNumInDb));
        orderId = 128 + 256 * 23;
        System.out.println(orderId + " db    index: " + getDbIndex(myHash, orderId, dbNum, tableNumInDb));
        System.out.println(orderId + " table index: " + getTableIndex(myHash, orderId, dbNum, tableNumInDb));

    }

    public static <R> int getDbIndex(Function<R, Integer> hash, R r, int dbNum, int tableNumInDb) {
        int mid = hash.apply(r) % (dbNum * tableNumInDb);
        return mid / tableNumInDb;
    }

    public static <R> int getTableIndex(Function<R, Integer> hash, R r, int dbNum, int tableNumInDb) {
        int mid = hash.apply(r) % (dbNum * tableNumInDb);
        return mid % tableNumInDb;
    }
}

第一次升级

现在1个库，每个库256张表
1000 db    index: 0
1000 table index: 232
1100 db    index: 0
1100 table index: 76
6016 db    index: 0
6016 table index: 128
现在变成两个库，每个库128张表
1000 db    index: 1
1000 table index: 104
1100 db    index: 0
1100 table index: 76
6016 db    index: 1
6016 table index: 0

第二次升级

现在1个库，每个库256张表
1000 db    index: 0
1000 table index: 232
1100 db    index: 0
1100 table index: 76
6016 db    index: 0
6016 table index: 128
现在变成两个库，每个库128张表
1000 db    index: 1
1000 table index: 104
1100 db    index: 0
1100 table index: 76
6016 db    index: 1
6016 table index: 0
现在变成4个库，每个库64张表
1000 db    index: 3
1000 table index: 40
1100 db    index: 1
1100 table index: 12
6016 db    index: 2
6016 table index: 0