摘要
上一篇文章已经说根据school_id进行分表。通常我们的分表策略有两种方式
- 取模分表
- 范围分表
取模分表
所谓的取模分表就是对分表key取模,通过预估数据量确定分几张表那么则模以几。
在我们设计系统之前,可以先预估一下大概这几年的数据量,如:8000万。每张表我们可以容纳2000万,也我们可以设计4张表进行存储。对指定的路由key(如:school_id)对分表总数进行取模,上图中,id=13的任务,对4进行取模,也就是会得到1,那此订单会放到1表中。id=26的订单,取模得到为2,就会放到2表中。
优点
任务数据可以均匀的放到那4张表中,这样此任务进行操作时,就不会有热点问题。
学习任务有个特点就是时间属性,一般用户操作任务数据,都会集中到这段时间的任务。如果这段时间产生的任务都在同一张任务表中,那就会形成热点,那张表的压力会比较大。
缺点
将来的数据扩容会很难。
随着业务的发展时间的推移,学习任务量很大,超出了8000万的量,那我们就需要增加分表数。如果我们增加4个表。一旦我们