导言
学习者语料库(Learner Corpus)是外语/第二语言学习者产生的真实文本的集合。它不仅可以用于第二语言习得研究,还可以识别特定学习者群体(例如中级学习者)在学习中的典型困难,从而为识别学习者语言中经常发生的错误提供帮助。-ONE-
汉语学习者语料库标注平台
汉语学习者语料库标注平台是由北京语言大学语言监测与智能学习研究小组研发的,其目的是对汉语学习者语料进行偏误标注,建构语料库。汉语学习者语料库立足于智能计算机辅助语言学习,构建完成后,将在对外汉语教学研究、汉语学习者的语言能力研究、中介语系统研究、偏误分析等研究领域发挥作用。 截至目前,我们招募到了142名偏误标注人员,已标注了的语料总和为:2326篇文章,31451个句子,546572个字。标注工作仍在持续进行中,如有意愿参与标注,请投递简历,详见 下一条招募令推文 。-TWO-
偏误标注体系的建立
偏误类型界定
偏误是指“中介语与目的语规律之间的差距” (鲁健骥,1984)。比如,某位汉语学习者在遇到心仪的对象时,忍不住向对方表白