分库分表的利弊分析与探究

最新推荐文章于 2025-03-27 02:45:31 发布

敲键盘的小夜猫

最新推荐文章于 2025-03-27 02:45:31 发布

阅读量1.7k

点赞数 30

文章标签： oracle 数据库

本文链接：https://blog.csdn.net/qq_30294911/article/details/136690768

版权

优缺点分析

优点：

1）解决数据库本身瓶颈

连接数过多时，就会出现‘too many connections’的错误，访问量太大或者数据库设置的最大连接数太小的原

Mysql默认的最大连接数为100.可以修改，而mysql服务允许的最大连接数为16384

数据库分表可以解决单表海量数据的查询性能问题

数据库分库可以解决单台数据库的并发访问压力问题

2）解决系统本身IO、CPU瓶颈

磁盘读写IO瓶颈，热点数据太多，尽管使用了数据库本身缓存，但是依旧有大量IO,导致sql执行速度慢

网络IO瓶颈，请求的数据太多，数据传输大，网络带宽不够，链路响应时间变长

CPU瓶颈，尤其在基础数据量大单机复杂SQL计算，SQL语句执行占用CPU使用率高，也有扫描行数大、锁冲突、锁等待等原因

缺点：

1）跨节点数据库Join关联查询和多维度查询

数据库切分前，多表关联查询，可以通过sql join进行实现，但分库分表后，数据可能分布在不同的节点上，sql join带来的问题就比较麻烦

2）不同维度查看数据，利用的partitionKey是不一样的

订单表的partionKey是user_id，用户查看自己的订单列表方便，但商家查看自己店铺的订单列表就麻烦，分布在不同数据节点

3）执行的SQL排序、翻页、函数计算问题

分库后，数据分布再不同的节点上，跨节点多库进行查询时，会出现limit分页、order by排序等问题，而且当排序字段非分片字段时，更加复杂了，要在不同的分片节点中将数据进行排序并返回，然后将不同分片返回的结果集进行汇总和再次排序（也会带来更多的CPU/IO资源损耗）

4）数据库全局主键重复问题

常规表的id是使用自增id进行实现，分库分表后，由于表中数据同时存在不同数据库中，如果用自增id，则会出现冲突问题

5）容量规划,分库分表后二次扩容问题

业务发展快，初次分库分表后，满足不了数据存储，导致需要多次扩容

6）分库分表技术选型问题

市场分库分表中间件相对较多，框架各有各的优势与短板，应该如何选择

分库分表模式

垂直分表

含义：也就是“大表拆小表”，基于列字段进行的，拆分原则一般是表中的字段较多，将不常用的或者数据较大，长度较长的拆分到“扩展表如text类型字段，访问频次低、字段大的商品描述信息单独存放在一张表中; 访问频次较高的商品基本信息单独放在一张表中。例如商品详情一般是拆分主表和附表；

垂直拆分原则：1）把不常用的字段单独放在一张表;2）把text，blob等大字段拆分出来放在附表中;3）业务经常组合查询的列放在一张表中

//拆分前
CREATE TABLE `product` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `title` varchar(524) DEFAULT NULL COMMENT '视频标题',
  `cover_img` varchar(524) DEFAULT NULL COMMENT '封面图',
  `price` int(11) DEFAULT NULL COMMENT '价格,分',
  `total` int(10) DEFAULT '0' COMMENT '总库存',
  `left_num` int(10) DEFAULT '0' COMMENT '剩余',
  
  `learn_base` text COMMENT '课前须知，学习基础',
  `learn_result` text COMMENT '达到水平',
  `summary` varchar(1026) DEFAULT NULL COMMENT '概述',  
  `detail` text COMMENT '视频商品详情',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;


//拆分后
CREATE TABLE `product` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `title` varchar(524) DEFAULT NULL COMMENT '视频标题',
  `cover_img` varchar(524) DEFAULT NULL COMMENT '封面图',
  `price` int(11) DEFAULT NULL COMMENT '价格,分',
  `total` int(10) DEFAULT '0' COMMENT '总库存',
  `left_num` int(10) DEFAULT '0' COMMENT '剩余',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

CREATE TABLE `product_detail` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `product_id` int(11) DEFAULT NULL COMMENT '产品主键',
  `learn_base` text COMMENT '课前须知，学习基础',
  `learn_result` text COMMENT '达到水平',
  `summary` varchar(1026) DEFAULT NULL COMMENT '概述',  
  `detail` text COMMENT '视频商品详情',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

垂直分库

垂直分库针对的是一个系统中的不同业务进行拆分，数据库的连接资源比较宝贵且单机处理能力也有限；没拆分之前全部都是落到单一的库上的，单库处理能力成为瓶颈，还有磁盘空间，内存，tps等限制，拆分之后，避免不同库竞争同一个物理机的CPU、内存、网络IO、磁盘，所以在高并发场景下，垂直分库一定程度上能够突破IO、连接数及单机硬件资源的瓶颈。垂直分库可以更好解决业务层面的耦合，业务清晰，且方便管理和维护，一般从单体项目升级改造为微服务项目，就是垂直分库。

C端项目里面，单个数据库的CPU、内存长期处于90%+的利用率，数据库连接经常不够该场景下可采用该垂直分库方式；

垂直分库分表可以提高并发，但是依然没有解决单表数据量过大的问题

水平分表

把一个表的数据分到一个数据库的多张表中，每个表只有这个表的部分数据，核心是把一个大表，分割N个小表，每个表的结构是一样的，数据不一样，全部表的数据合起来就是全部数据，针对数据量巨大的单张表（比如订单表），按照某种规则（RANGE,HASH取模等），切分到多张表里面去，但是这些表还是在同一个库中，所以单数据库操作还是有IO瓶颈，主要是解决单表数据量过大的问题。减少锁表时间，没分表前，如果是DDL(create/alter/add等)语句，当需要添加一列的时候mysql会锁表，期间所有的读写操作只能等待。