又到了准备JLPT(日本語能力試験)考试的日子。每次看到众多日语学习者怀着惴惴不安的心情前往考场考试,3个小时的鏖战之后,拖着疲惫的身体出来,还要再找各种网站来估一下分,再被狠狠打击一次。我就会想
真是残忍的一天。
当我认真的研究了日本语能力测试的评分方法后,我一直这么想。
为什么要去估分呢?明明没有一家能估出真实成绩,甚至连近似成绩都不可能。
我们都知道,2010年,日本语能力测试进行了一次大规模的改革,而早在2009年,日本语能力测试将要进行改革之前,官方已经给出了变更的指南手册。
http://www.jlpt.jp/reference/pdf/guidebook1.pdf


很多人都知道日本語能力試験的级别从原来的4级到1级,变成了N5级到N1级,但很少有人会去注意上面第5页的“③「得点等化」を行います”。
得点等化是个什么鬼?按照解释,得点等化是为了使在不同难度的不同次考试中,获得的同样点数保持可比性,进行的一种措施。
参考一下下图 (图片来源:日本留学試験における得点等化について)

虽然是日本留学考试EJU的图,实际原理是一样的。在甲乙丙丁四次考试中,考生A的成绩均比考生B高,理应判定考生A的能力更强,但如果按考试原始分数的话,如果拿考生A参加的考试乙的成绩,和考生B参加的考试丙的成绩比较,就会得出考生B的水平更高的错误结果。
所以,要经过得点等化,将考生A和B的能力换算成一个标准分值进行比较。
具体点说的话,假设你和所有的其他考生在同一个适合散步的日子的上午和下午,参加了两次不同的JLPT考试,上午的一次很简单,很多题你都会,但是下午的题比较难,很多题你都不会。正常情况下考完之后可能你就觉得,上午这次我能考很高分,下午这次可能要挂。对不对?但是实际上,你会发现,两次考试的最终成绩居然基本是一样的。这就是因为大家的分数经过了「得点等化」这一步骤。
特别具体的得点等化的方法这里就不介绍了。有兴趣的人可以去查一下「項目反応理論」,基本上就是说每一道题事先都会有一个预设的难度,实际得分是按照最终你能答对个大约什么难度的问题来给分。
简化一下的话,比如阅读考试满分是60,共20道题,现在题库里有1000道题,分别属于难度1-60,于是随机从各题型中抽取了20道满足考试题型需求的题,基本平均分布在30-60分里。你参加了这个考试,考试的结果发现你的30-45分的10题全对了,但是更难的10道题你全错了。你得了45分。你觉得题太难,又去刷了一次。结果这次题的难度平均分布在1-60分区域。于是你对了15道,错了5道。你自我感觉良好:太好了这次分肯定高。结果出来一看还是45。因为你的实力就是45,你答不对比那更难的题,也不会答错更简单的题。
当然,实际的JLPT比这个要复杂得多,但是原理简化后就是这样的。
利用类似方式评分的考试有很多,比如TOFEL。再比如有一个免费的网上日语考试:
J-CAT Japanese Computerized Adaptive Test
也是采用这种方法。据之前我写信给J-CAT官方咨询得到的回答是,题数在15-17题左右,就可以控制判定误差在3%以下。但是J-CAT考试是根据上一题难度及回答正确与否从题库中抽取下一题,而JLPT是预先给出各种难度的问题,让考生回答后看结果。所以可以说J-CAT比JLPT能更快的判定一个人的日语水平(当然它题库有点小),也是我一直推荐用这个考试来自行判定一下当前日语能力的原因。
到这里,我们就大致知道了,除非你知道这次考试的所有题目,在整个题库中代表的难度系数,特别是你自己答对的问题究竟是什么难度系数的问题,否则是无法计算出分数的。
我们也知道了,要提高自己的分数,最好的方式就是,努力学习,争取能够答对更多更优质的题。
那么,什么题叫优质题呢?
对于一道考试用题,是有两个参数来衡量的,一个参数是难度,也就是这道题代表的能力系数。而另一个是题的区分度,也就是说,这道题测试水平的能力,是否能够通过这道题,准确的判断出学生的能力,让有这个能力的学生都能答对,没这个能力的学生全都答错,这就是题的区分度。其实还有一个参数叫猜测系数,说白了就是好不好蒙,当然这个数值越高,这题就越没用。所以简单来看只要重视高区分度和高难度的题就可以了。
在考试中,能答对一道有极高区分度的题,基本上分数就会提升至这个题的难度代表的分数以上。这就是答对典型题的重要性。
典型题一般集中在中等分数段,我们看一下考试成绩的分布图就知道了

可以看到曲线在60-120左右是比较陡的,这个分数段的典型题比较多,以尽量正确判定是否学生真的有100分的能力,获得合格。而你想答到40分以下,或者140分以上,是比较难的,可能的原因是:40分以下的题本来就少,以及想达到180分,需要在高难度区有极高的正确率。(这个时候可能低分区题的一个错误反而并不是那么重要,谁都偶尔会犯低级错误,但这不影响真实水平的判断。)
接下来是小彩蛋,说说为什么大家都说刷真题对备考是有极大帮助的,甚至有人只刷真题,就过了N1。因为,真题里,藏着典型题考查的考点,比任何一本练习册都更接近考试实际想要考察的重点。以撩妹为例的话,语法书,是让你学一些理论知识,练习册,是让你拥有一些经验资本,而搞定了真题,基本上就和搞定了妹子的闺蜜是差不多的了。
最后,从历年的数据上,我们可以看到,每次N1考试的合格率都在33-34%左右。0.5-0.7%的人获得满分,乘一下考生数9-10万人,可以知道每次大约都有3万多人合格,500-600人满分。这不是个小数目。说实话,以我个人的感觉,使用日语的最好的工作,每年并不会增加1000个岗位,但是N1满分的人年年在增加,拥有N1资格的人更是每年增加6-7万。所以,别说拿到N1,就算N1满分,也远远不是终点。学习永不停止,还愿各位牟足了劲儿,咱们一起面对知识,保持好奇心~
感谢阅读。