mysql range hash分库+分表+分区

一、方法

<?php

/**
*@Description 该系列函数,用于库表分离下,根据主键id获取库和表
*@param $id int 主键id 必须
*@param $tbName string 必须
*@param $dbName string 非必须,默认db开头
*@return array db名称 表名称
*/

$dbNum=2;
$tbNum=5;
$perNum=1000;
// 数据库名称类似:db1,db2...表名字类似 user1,user2...

// range获取库和表
function range_insert($id, $tbName ,$dbName='db'){
	$tb = $id % ($dbNum * $tbNum) + 1;
	$db = ceil($tb / $tbNum);
	return [$dbName.$db, $dbName.$db.'_'.$tbName.'_'.$tb];
}

// 哈希获取库和表
function hash_insert($id, $tbName, $dbName='db'){
   $str = decbin($id) >> 2;
   $str = bindec($str);
   $str = sprintf('%08d',$str);
   $num = crc32($str2);
   $tb = $num % ($dbNum * $tbNum) + 1;
   $db = ceil($tb / $tbNum);
   
   return [$dbName.$db, $dbName.'_'.$tbName.'_'.$tb];
}

//线性哈希获取库和表
function linearHash_insert($id, $tbName, $dbName='db'){
   $v = pow(2,ceil(log( $dbNum * $tbNum,2)));
   $p = $id & ($v - 1);
   
   if($p >= $dbNum * $tbNum){
      $p = $p & (ceil($dbNum * $tbNum / 2) - 1);
   }
   
   $tb = $p % ($dbNum * $tbNum) + 1;
   $db = ceil($tb / $tbNum);
   
   return [$dbName.$db, $dbName.$db.'_'.$tbName.'_'.$tb];
}

//获取字符串
function getStr($num){
	$string = '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
	$str = '';
	for($i=0;$i<$num;$i++){
		
		$str .= substr($string,mt_rand(0,61),1);
	}
	
	return $str;

}?>

二、调用

<?php
include 'partition_db_func.php';

$con = mysqli_connect("localhost","root","admin123987+..");

if(!con){
	die('数据库连接失败');
}

$con = mysqli_set_charset($con, 'utf8');
// 3种方式插入数据10万条数据


// 方式1 range方式
for($i=1;$i<=100000;$i++){
	$arr = range_insert($i, 'user');
	$con = mysqli_select_db($con, $arr[0]);
	$str = getStr(8);
	$result = mysqli_query($con,"insert into $arr[1] values($i,$str));
}

mysqli_close($con);

//方式二 hash方式
for($i=1;$i<=100000;$i++){
	$arr = hash_insert($i, 'user2');
	$con = mysqli_select_db($con, $arr[0]);
	$str = getStr(8);
	$result = mysqli_query($con,"insert into $arr[1] values($i,$str));
}

//方式三 linear_hash方式 (没什么用,了解思路就行)
for($i=1;$i<=100000;$i++){
	$arr = linear_hash_insert($i, 'user3');
	$con = mysqli_select_db($con, $arr[0]);
	$str = getStr(8);
	$result = mysqli_query($con,"insert into $arr[1] values($i,$str));
}
?>

三、分区

range分区

// 如果表存在主键或唯一索引,则分区字段必须是唯一索引的一部分

CREATE TABLE `part_order` (
  `id` int(11) NOT NULL,
  `name` varchar(255) NOT NULL DEFAULT '',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  `year` int(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`,`year`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
PARTITION BY RANGE (year)
(PARTITION p0 VALUES LESS THAN (2021) ENGINE = InnoDB,
 PARTITION p1 VALUES LESS THAN (2022) ENGINE = InnoDB,
 PARTITION p2 VALUES LESS THAN (2023) ENGINE = InnoDB,
 PARTITION p3 VALUES LESS THAN MAXVALUE ENGINE = InnoDB)  // MAXVALUE的存在会造成不允许增加新的分区

测试:

explain partitions select count(*) from part_order where id = 10 and year > 2021

结果:
在这里插入图片描述

hash分区

// 根据主键的hash值进行分区,适合equal查询 不适合区间查询

CREATE TABLE `hash_order` (
  `id` int(11) NOT NULL,
  `name` varchar(255) NOT NULL DEFAULT '',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  `year` int(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
PARTITION BY HASH (id)
(PARTITION p0 ENGINE = InnoDB,
 PARTITION p1 ENGINE = InnoDB,
 PARTITION p2 ENGINE = InnoDB,
 PARTITION p3 ENGINE = InnoDB) 

测试

执行 explain partitions select count(*) from hash_order where id =1

结果:
在这里插入图片描述

list分区

// 必须是主键的一部分,类似range,不过数据必须是list的值,否则报错,适用与类型固定的,不如range范围广

CREATE TABLE `list_order` (
  `id` int(11) NOT NULL,
  `name` varchar(255) NOT NULL DEFAULT '',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  `year` int(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`,year)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
PARTITION BY list (year)
(PARTITION p0 values in(2019),
 PARTITION p1 values in(2020),
 PARTITION p2 values in(2021),
 PARTITION p3 values in(2022))

测试:

explain partitions select count(*) from list_order where id = 10 and year > 2019

结果:
在这里插入图片描述

key分区

// key分区跟hash分区类似,区别时hash只支持数字类型字段分区,而key分区特别提供了对非数字类型字段进行分区,以下只做简要介绍

CREATE TABLE `key_order` (
  `id` int(11) NOT NULL,
  `name` varchar(255) NOT NULL DEFAULT '',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  `year` int(4) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`,`year`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
PARTITION BY key (id)
(PARTITION p0 ENGINE = InnoDB,
 PARTITION p1 ENGINE = InnoDB,
 PARTITION p2 ENGINE = InnoDB,
 PARTITION p3 ENGINE = InnoDB)
分区性能测试
  • 300万条数据 ,range分区

没有分区:
在这里插入图片描述

有分区:
在这里插入图片描述

结论:性能差距非常小,所以分区的作用并不大
  • 800万条数据,hash分区

不适用分区:
在这里插入图片描述
使用分区:
在这里插入图片描述

结论:性能差距非常小,所以分区的作用并不大
分区修改

1、range分区(经过测试)

增加:

alter table part_order add partition (partition p3 values less than (MAXVALUE))

重建:

alter table part_order reorganize partition p0,p1 into (partition p0 values less than (2022))

删除

alter table part_order drop partition p3

2、hash/key分区(未经测试)

增加:
ALTER TABLE users ADD PARTITION PARTITIONS 8;

重构:
ALTER TABLE users REORGANIZE PARTITION COALESCE PARTITION 2; #用 REORGANIZE 方式重建分区的数量变成2,在这里数量只能减少不能增加。想要增加可以用 ADD PARTITION 方法。

删除同range

3、list分区(未测试)

增加:
ALTER TABLE category ADD PARTITION (PARTITION p4 VALUES IN (16,17,18,19)

重构:
ALTER TABLE users REORGANIZE PARTITION p0,p1 INTO (PARTITION p0 VALUES IN(0,1,4,5,8,9,12,13));#将原来的 p0,p1 分区合并起来,放到新的 p0 分区中。

删除同range

结论:分区对sql性能提升并不明显

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: MySQL分库分表是一种常用的水平扩展数据库的方法,它将一个大的数据库按照一定的规则分成多个小的数据库,每个小的数据库再按照一定的规则分成多个小的表,从而达到分布式存储和负载均衡的目的。 下面是一个基本的分库分表方案: 1. 水平分库 将一个大的数据库按照某种规则分成多个小的数据库,例如按照用户ID取模进行分库,将用户ID为奇数的用户存储在一个数据库中,将用户ID为偶数的用户存储在另一个数据库中。需要注意的是,分库后不同的数据库之间要保证数据的一致性,可以通过主从复制或者分布式事务来保证。 2. 水平分表 将一个小的数据库按照某种规则分成多个小的表,例如按照时间进行分表,将不同时间段的数据存储在不同的表中。需要注意的是,分表后不同的表之间要保证数据的一致性,可以通过分布式锁或者分布式事务来保证。 3. 垂直分表 将一个大的表按照某种规则拆分成多个小的表,例如将相对独立的字段分成一个表,将经常更新的字段分成一个表。需要注意的是,分表后需要通过JOIN操作来获取完整的数据,可能会影响查询性能。 总之,分库分表是一种比较复杂的技术,需要根据具体情况进行设计和实现。建议在实际应用中采用成熟的分库分表中间件,例如ShardingSphere、TDDL等。 ### 回答2: MySQL分库分表是将一个大型的数据库按照一定的规则拆分成多个小的数据库和表,以提高数据库的性能和扩展性。 分库分表的方法有两大类:垂直拆分和水平拆分。 垂直拆分是将一个大的数据库按照业务功能或者数据类型分成多个小的数据库。比如将用户数据、订单数据等不同的业务数据存放在不同的数据库中。 水平拆分是将一个大的表按照一定的规则拆分成多个小的表。一般通过hashrange或者列表等方式进行拆分。比如按照用户ID的hash值来拆分用户数据表,或者按照订单的创建时间范围来拆分订单数据表。 在使用分库分表的过程中,需要考虑以下几个方面: 1. 数据一致性:需要确保拆分后的库表之间的数据一致性。可以通过分布式事务或者通过应用程序来保证数据的一致性。 2. 查询路由:在进行数据查询时,需要确定对应的查询路由规则,将查询路由到正确的数据库和表中。 3. 数据迁移:在进行分库分表之前,需要将现有的数据进行迁移。可以使用工具进行数据迁移,或者通过应用程序将数据重新插入到分库分表中。 4. 垂直拆分和水平拆分的选择:根据业务需求和数据库性能来选择合适的拆分方式。 5. 分库分表的动态性:根据业务需求,可能需要对分库分表进行动态调整,需要考虑如何动态调整和迁移数据。 6. 分布式事务的处理:如果涉及到多个数据库的事务处理,需要考虑分布式事务的处理方式。 总之,MySQL分库分表可以通过垂直拆分和水平拆分的方式将一个大型的数据库分成多个小的数据库和表,以提高数据库的性能和扩展性。但在进行分库分表之前,需要考虑数据一致性、查询路由、数据迁移等问题。 ### 回答3: MySQL进行分库分表可以采用垂直分库和水平分表的方式。 垂直分库是将原始数据库按照不同的业务功能或业务模块划分为多个独立的数据库。这样每个数据库只存储与其相关的数据,分离了数据的关联性,提高了数据库的性能和扩展能力。垂直分库可以按照功能拆分,比如将用户相关的数据存放在一个库中,将订单相关的数据存放在另一个库中,以此类推。分库后可以根据业务的发展和负载的变化,对不同的库进行独立扩容,提高了系统的稳定性和可靠性。 水平分表是将单一的数据库表按照某种规则拆分为多个子表,每个子表只包含一部分数据。拆分的规则可以是按照某个字段进行拆分,比如按照用户ID、日期等字段,也可以是按照均匀分布的方式进行拆分。水平分表可以提高数据库的读写性能,分散了数据的压力。在查询时,可以根据查询条件将查询请求发送到不同的分表进行查询,最后再将结果合并返回。在新增数据时,可以根据规则将数据插入到相应的分表中,实现数据的均衡存储。 在实际应用中,可以根据系统的需求和数据的规模选择适合的分库分表方案。在进行分库分表时,需要考虑到数据一致性、跨库查询和业务拆分等问题,并合理规划数据库的关联性和数据的拆分规则。同时还需要注意分库分表带来的管理和维护复杂性,比如跨库事务、分表查询等问题,并选择合适的工具和解决方案进行支持和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值