分库分表是为了解决传统数据库,单表数据量较大而导致的吞吐量下降的一种有效手段,但是不建议无脑的分库分表,分库分表的方案设计,要考虑分表字段、分表算法、全局ID的选择,还会带来跨表查询、跨事务等问题,而且分库分表之后,基本上告别了分页查询和排序。当然都有折中的方案解决,不过不建议。
首先,一些数据库的基本优化方案,单表2000W,做好索引,减少多表Join,适量的字段冗余,其实大多数情况下能扛得住的,
其次,增加缓存,把能接受延迟的、数据变化实时性要求不是这么高的,放到本地换成或者分布式缓存当中
然后,数据归档:冷热数据的隔离,把那些更新和查询,不频繁的数据,单独隔离出来,放到历史表,或者离线数仓之中,减少表中的数据量,来提升效率。
再次,数据库分区,放不同的分区,不同的表
最后,分布式数据库,将数据数据放到不同的节点上
优化、缓存、归档、分区先尝试一遍,实在不行,再分库分表