为了区分高年级和低年级的模型,我们决定采用区分输入预料的方法来针对不同年级,训练不同的模型: 对于高年级,采用“2014 人民日报”作为训练集进行训练,大小为116 MB;对于低年级,采用找到的“儿童文学”语料作为训练集,大小目前为16.1 MB,之后应该还要扩充;