分库分表的基基基础知识

最新推荐文章于 2024-10-08 17:39:57 发布

Day_Day_Up_33

最新推荐文章于 2024-10-08 17:39:57 发布

阅读量40

点赞数

文章标签：数据库服务器 mysql

本文链接：https://blog.csdn.net/m0_55679301/article/details/129962329

版权

随着业务发展，数据库可能面临性能、可用性等问题，此时需要进行分库分表来提升性能和可用性。分库分表包括垂直切分（按业务拆分）和水平切分（按数据量拆分），但也会引发数据定位、事务一致性、分页排序等问题，需要相应的解决方案来应对。

摘要由CSDN通过智能技术生成

随着规模的增大，数据库可能会遇到的问题？

面对上述问题，常见的优化手段有：索引优化、主从同步、缓存、分库分表

单机的存储能力、连接数是有限的，自身就很容易会成为系统的瓶颈。
当单表数据量在百万以内时，可以通过添加从库、优化索引提升性能。
如果数据量朝着千万级以上趋势增长，或者突破千万级，那么即使再怎么优化单个数据库实例，很多数据操作的性能仍严重下降。这时候，为了减少数据库的负担，提升数据库响应速度，缩短查询时间，就需要进行分库分表。

性能角度：CPU、内存、磁盘、IO 瓶颈
- 随着业务体量扩大，数据规模达到百万行，数据库索引树庞大，查询性能出现瓶颈。
- 用户并发流量规模扩大，由于单库(单服务器)物理性能限制也无法承载大流量。
可用性角度：单机故障率影响面
- 如果是单库，数据库宕机会导致100%服务不可用，N 库则可以将影响面降低N倍。

垂直拆分就是对数据内容进行拆分，将一条记录拆分到多个表或是将多个业务信息拆分到多个库中。垂直拆分的原则一般按照业务类型来拆分，核心思想是专库专用，将业务耦合度比较高的表拆分到单独的库中

数据库是以行为单位将数据加载到内存中，这样拆分以后，核心表大多是访问频率较高的字段，而且字段长度也都较短，可以加载更多数据到内存中，增加查询的命中率，减少磁盘IO，以此来提升数据库性能。

优点：

缺点：

将一张大数据量的表，切分成多个表结构相同的小表，而每个小表只占原表一部分数据，然后按不同的条件分散到单个或多个数据库中。

库内分表：虽然将表拆分，但是子表都还在同一个数据库实例中，只解决了单一表数据量过大的问题，并没有将拆分后的子表分布到不同机器的库上，还在竞争同一个物理机的CPU、内存、网络IO。
分库分表：将切分出的子表，分散到不同的数据库中，从而使得单个表的数据量变小，达到分布式的效果。

优点：

缺点：

Range 区间：对于水平切分，根据时间区间或者是 ID 范围来确定访问哪一个库哪一个表
- 优点：
  - 单表数据量是可控的。
  - 水平扩展简单，只需增加节点即可，无需对其他分片的数据进行迁移。
  - 能快速定位要查询的数据在哪个库。
- 缺点：
  - 由于连续分片，可能存在数据热点问题。假如按时间字段分片，有些分片存储最近时间段内的数据，可能会被频繁的读写；而有些分片存储历史数据，则很少被查询。
Hash 取模：Hash 取模（对hash结果取余数 (hash() mod N)）的切分方式比较常见。
- 优点：
  - 数据分片相对比较均匀，不易出现某个库并发访问的问题。
- 缺点：
  - 当某一台机器宕机，本应该落在该数据库的请求就无法得到正确的处理。这时，宕掉的实例会被踢出集群，算法变成hash(userId) mod N-1，用户信息可能就不再在同一个库中。

使用多库进行查询时，limit分页、order by 排序着实让人比较头疼。