一、中文自动评分系统的构建方法
1、语料库构建步骤,用于构建中文作文语料库:
待评分作文获取步骤:
(1)获取待评分作文图片
(2)进行中文识别,得到作文文本
(3)直接获取待评分作文文本
2、浅层特征提取步骤,基于语料库提取作文的浅层特征
浅层特征提取步骤:
(1)处理待评分作文文本,得到作文文本的分词结果;
(2)根据分词结果,统计待评分作文的浅层特征;(具体包括句子数量、句子平均长度、全文字数、比喻句数量、拼音数量、词汇等级。)
3、深层语义特征提取步骤,基于语料库提取作文的深层语义特征,包括错别字特征和语法错误特征
深层语义特征提取步骤:提取待评分作文的深层语义特征,包括错别字特征和语法错误特征;
(1)提取错别字特征具体包括:
a.采用概率分词模型对作文进行分词;