说实话分库分表在实际生产环境没有用过,有一段时间专门研究过这个技术,其实核心的就是如何拆分的算法,最简单的就是直接按照id取模,然后分到对应的表中,复杂点的有一致性hash算法,或者hash 槽算法。说白了就是在实际的存储层的之前加一个映射层,比如hash取模后的结果0~1000的数据放到A库,1001~2000的数据放到B库,以此类推,这样就可以方便的解决扩容的问题。
紧接着又会产生一个问题,由于id是用的mysql自增id, 分库分表之后的id是不能直接由于mysql自增id生成,不然分到不同的表中会有重复id产生。所以,就要引入id生成器,这里推荐一个比较好的方案,用redis的incr命令。
另外一个问题就是,join查询,分库分表之后,join查询就很特别麻烦。
一般的解决方案是:
1、字段冗余,把需要查询的字段尽可能放到一个表中。
如果是类似统计需求,实时性要求不是太高可以单独生成一个统计表把需要的字段放一张表。
2、拆分join查询,相当于把原本一次查出来的sql拆分成多个sql。