方案
项目背景
在现在题库架构下,针对新购买的1300W多道数据进行整合,不影响现有功能。由于数据量偏多,需要进行数据的切分
目标场景
- 兼容旧的功能
- 对1300多W数据进行分库分表
- 需要对旧的数据进行整合
- 老师端选题组卷 可以根据 学段、学科、知识点、难度、题型 来筛选
- 学生端根据老师端所选题目获取对应的题目
- 对3年内以后扩展的增量数据预留数量空间
数据样例
学段数据量小学1285336初中6655780高中6144072学段学科数据量初中数学1869524初中化学1356224初中英语288440
切分方案一
- 切分为3个库, 分别是小学、初中、高中 数据占比如上
- 每个库切分10个表 根据 (学科+首级知识点)%10
- 每个库一个总表
缺点:例:用到不同知识点时,需要多表获取数据
优点:数据分布较为平均
切分方案二 (采用)
- 切分为3个库, 分别是小学、初中、高中 数据占比如上