mysql 分表和数据冗余

最新推荐文章于 2024-07-17 11:05:21 发布

zzm568599448

最新推荐文章于 2024-07-17 11:05:21 发布

阅读量3.7k

点赞数 2

分类专栏： mysql 文章标签： mysql 分表数据冗余

本文链接：https://blog.csdn.net/zzm568599448/article/details/50608566

版权

mysql 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文献表中有200W条数据

这里写图片描述

数据量比较大，字段在20个左右，其中有一些字段用到的频率会很低，也就是所谓的冷数据，从而考虑到分表的操作，将表进行垂直分割（下面的第一种表分割方式），将使用少的字段拆分到另外的表中。
1.保存数据的时候先将第一张表中的数据保存，然后获取主键保存另外一张表中的数据
2.并发高的时候会减少数据库压力，避免扫描不必要的数据

当一张的数据达到几百万时，你查询一次所花的时间会变多，分表的目的就在于此，减小数据库单表的负担，缩短查询时间。

1、拆分表的方式（主要有分表和分区）

1、分表

1.1、垂直分割

这里写图片描述
优势：降低高并发情况下，对于表的锁定。感觉有点像读写分离了。

1.2、水平分割

这里写图片描述
如果单表的IO压力大，可以考虑用水平分割，其原理就是通过hash算法，将一张表分为N多页，并通过一个新的表（总表），记录着每个页的的位置。假如一个门户网站，它的数据库表已经达到了1000万条记录，那么此时如果通过select去查询，必定会效率低下（不做索引的前提下）。为了降低单表的读写IO压力，通过水平分割，将这个表分成10个页，同时生成一个总表，记录各个页的信息，那么假如我查询一条id=100的记录，它不再需要全表扫描，而是通过总表找到该记录在哪个对应的页上，然后再去相应的页做检索，这样就降低了IO压力。

水平分表技术就是将一个表拆成多个表，比较常见的方式就是将表中的记录按照某种HASH算法进行拆分，同时，这种分区方法也必须对前端的应用程序中的SQL进行修改方能使用，而且对于一个SQL语句，可能会修改两个表，那么你必须要修改两个SQL语句来完成你这个逻辑的事务，会使得逻辑判断越来越复杂，这样会增加程序的维护代价，所以我们要避免这样的情况出现。

2.数据冗余

有两张表
文献和分类关系表：t_literature_category_relation(700w条数据) 文献和分类是n对n关系
文献表：t_literature(200w条)
业务场景：根据分类查询文献，并按照文献的发布时间排序

刚开始的做法是：先根据分类id查询出所有的文献id，然后查文献表根据文献发布时间排序
sql如下：
sql1：select literature_id from t_literature_category_relation where category_id = <分类id>;
sql2：select fields from t_literature where id in (sql1返回的文献id集合) order by publish_time limit rowStart,20;

第一条sql查出的id大约有10w左右，因为数据量大，加了索引花费的时间也要500ms，就已经不能满足响应时间小于0.5s的要求，sql2花费的时间更多，大概在2~3秒左右，响应时间就很长，用户体验会很差。

改进方案：
将文献表中的publish_time冗余到t_literature_category_relation中，在publish_time加索引
sql如下：
sql1：select literature_id from t_literature_category_relation where category_id=分类id order by publish_time limit rowStart,20;
sql2：select fields from t_literature where id in(sql1返回的20个文献id集合);
目前的时间都在100ms以内。

zzm568599448

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
mysql 分表和数据冗余

文献表有200W数据数据量比较大，字段在20个左右，其中有一些字段用到的频率会很低，也就是所谓的冷数据，从而考虑到分表的操作，将表进行垂直分割，然后了解了一些分表的知识，抛砖引玉一下。1、大表拆小表的方式（主要有分表和分区两者技术）（1）分表技术垂直分割优势：降低高并发情况下，对于表的锁定。不足：对于单表来说，随着数据库的记录增多，读写压力将进一步增大。水平分割如果单表的
复制链接

扫一扫