点击上方“讯飞易听说” 关注我吧!
2016年12月13日,深圳市教科院初中英语教研员李睿老师主持召开了2016年深圳市初三英语教学研讨活动。在会议中,刘舒作为中国科学技术大学技术专家受邀参与活动,发表了《初三英语听说考试人机对话系统解读》讲座。
“
本次讲座内容分为:
一、英语听说考试人机对话系统介绍;
二、计算机智能评分数据实验解读;
三、机器评分原理解读。
精彩现场:
听说考试人机对话系统介绍
科大讯飞听说智能考试技术是通过教育部鉴定并大规模应用的考试技术。为了让老师们更加了解该考试系统,在日常教学中更好地指导学生进行学习,刘舒在会议上详细解读了听说考试人机对话系统,并对2016年深圳中考听说考试机评数据实验做了解读。
广东省高考,广州市、深圳市、肇庆市、江门市、东莞市和中山市的中考英语听说考试均采用该人机对话考试系统,因此,该系统的使用方法同样适用于这些地市的英语听说考试。
考前检测
在正式考试前,我们需要对监考机、考生机和网络进行检测,如检查磁盘分配是否合理,考生机的磁盘空间是否大于5G,音量调节等方面是否正常,以及网络调试是否完成等。具体要求如下:
12
考生机
操作系统:
推荐使用win7
注意事项:
1.客户端系统做好杀毒、防毒清理工作;
2.工作磁盘空间>=5G;
3.麦克风能正常录音,录音效果符合考试要求;
4.去掉屏保,并将“电源”各选择设置为“从不”;
5.客户端工作磁盘可写入数据并能保存;
6.系统做好杀毒、防毒清理工作;
7.音量大小可调节,符合考试要求。
12
网络
网络交换是否100M以上?
考场之间是否通畅?
单个考生机访问监考机的网络速度是否大于5M Bytes/秒?
考前操作事项
在正式考前,需要先点击【清除历史】,清除平时练习产生的历史信息。
同时要做好系统设置:
将客户端工作盘设置为非系统盘(如D盘,此时需确保D盘容量大于5G,并且可写入数据)。
考试流程
整个考试流程如下:
主要操作流程在监考机上面完成,由监考老师进行。
考生机只需要完成考生登录、录音测试和考试,无需做其他操作。
考点检查事项
12
耳机检查
按照《2016年深圳市中考英语口语考点检查报告》中的考点环境、耳麦、声卡、麦克风增强设置等进行逐项检查,麦克风增强功能需要关闭。
注意:建议选择教育局指定耳机供应商
12
模拟练习
考前需要组织学生模拟测试练习,给学生强化训练,避免因技术性错误导致失分。
注意:建议使用教育局指定模考系统
计算机智能评分数据实验解读
2012、2013年广东省
高考英语听说考试验证情况
在2012年、2013年,在广东省考试院的组织下,基于2012、2013年高考考生成绩对科大讯飞智能评分技术进行了验证。
验证的结果是,机器评分与专家评分的相关度达到98%,超过多数对照阅卷员。总分平均误差率0.032,小于多数对照阅卷员。
因此,2014年,广东高考英语听说考试正式启用机评。
2016年深圳中考
英语听说考试机评数据实验
2016年深圳中考英语听说考试已顺利完成考试,并组织老师完成了人工评卷,为验证计算机智能评测技术在英语听说考试中的评测效果,为全面提升项目智能化水平提供依据,在深圳市教科院的统一安排组织下,利用科大讯飞智能评测技术对考生答卷数据进行了智能评卷。
为更好了解智能评卷效果,我们对智能评测成绩与人工评卷成绩进行了对比分析。
对比分析结果为:人工评卷和智能评卷在考生总分上两者的相关度为0.971,平均误差率为0.036。
本次数据验证结论:智能评卷技术各项指标符合高利害考试要求,建议在2017年英语听说考试评卷中,以人机双评代替现有评卷机制,保障考试公平、公正,降低评卷组织难度。
(本次数据实验样本:Paper1-Paper8,共计8套试卷,60304名考生。Paper9人数少于400人未纳入智能评卷)
机评原理介绍
1
机器评分原理
过程:人工专家打分定标—>提取采分特征—>算出采分特征权重—>建立评分模型—>应用正式评分
核心:通过人工智能技术把专家打分的标准算出来,并且忠实无误、公平公正地执行专家的打分标准。
要做到与评分专家保持一致的评分标准,需要做到以下几个关键步骤:
第一,提取评分特征。
一段录音的评分过程实际上就是对多个特征进行打分的过程。影响评分的特征主要可分为三类:
语音的完整性;
语音的音段质量;
语法和语义。
计算机智能评分系统是通过三种技术实现对评分特征的抽象提取,分别是:语音转文字技术、语音模型分析技术和深度神经网络技术。
通过以上三种技术,计算机智能评分系统就可将所有特征都提取出来。
第二,反算特征权重。
提取出所有的特征之后,再通过人工智能技术对专家打分数据进行分析,反算出每个特征权重。
每次考试的成绩都会先抽取一部分样本录音,经过人工专家进行打分,人工专家会根据评分标准对每一段录音进行打分,但此时的评分标准实际上只是一些描述性的语句(如2016年模仿朗读满分标准为:发音清晰、准确,语调正确、自然,语流连贯、流畅;按原语速,且内容完整),无法进行定量表达。而且,专家打分的过程是一个综合性思考的过程,专家自己也无法将所有特征都列举出来。这时候,只有通过人工智能技术,对专家打分的数据进行分析,才能把每个特征相对应的权重反算出来,从而建立该道题的评分模型——我们可以简单理解为一个公式。
第三,根据评分模型进行打分。
将建立好的评分模型输入到计算机智能评分系统中,该评分系统才可以真正运用于其他录音的评分。
对于每一段新的录音,该评分系统都会根据建立好的评分模型提取出该段录音相应的特征,并且根据不同特征的相关权重进行打分。从而确保该评分系统的评分标准与专家的评分标准保持一致。
总结:科大讯飞智能评分系统,是通过三种技术将所有语音特征提取出来,再通过大数据分析将专家打分的数据反算出所有特征相应的权重,建立一个评分模型,确保评分标准与专家完全一致,通过该评分模型就可以实现对其他录音的精准评分。
以上,就是计算机智能评分的全部原理和过程。
2
针对三大题型的特征权重表
我们通过人工智能技术和大数据反算出广州中考和深圳中考英语听说考试三种不同题型的评分特征权重值,如下表。该内容也在广东初中版《英语听说人机对话考试权威教程》书中有详细阐述。
以上所列举的特征及相应的权重,还有相应的易错点及技巧,对于学生在学习过程中具有重要的指导意义,三种题型所有的易错点和技巧都可以在广东初中版《英语听说人机对话考试权威教程》中找到,该书将会在12月底出版上市,建议考生重点阅读。
以上是今天活动的全部内容,更多关于英语听说考试权威资讯和教学研究成果,敬请关注讯飞易听说!