语言标注
英文条头:Language Glossing
学科主编:刘丹青
分支学科:功能—认知语言学和语言类型学 分支主编:张伯江 副主编:金立鑫 束定芳类型学研究中对语言材料进行技术处理的一种常见方法,也称为语言行间标注(interlinear glossing),指出现在原始文本(original text)和翻译文本(translation text)之间的一系列对原始文本各成分意义的描述和定义。行间标注的主要功能是能够使读者追踪到原始文本和翻译文本各成分之间的对应关系,帮助读者明确理解原始语言的结构(Lehmann,2004)。
语言标注一般牵涉到两种语言:对象语言(object language)和元语言(metalanguage)。对象语言是被标注的原始语言,即为描写者所描写、想使读者了解的目标语言。元语言是指进行标注和翻译所用的语言,一般是文章或著作的写作语言。按照莱曼(Lehmann,2004)的观点,语言标注就是使用一连串的元语言成分对对象语言需要处理的材料进行注释。理想状态下,对象语言文本中的每个语素都要使用元语言中的一个语素或其他语言单位进行标注,同时元语言的成分顺序对应于对象语言中被标注成分的顺序。也就是说,语言标注就是使用特定语言对另外一种语言的材料按照一定规则进行逐词或逐语素标注。有时人们取更广义的说法,把包括转写、标注和翻译在内的对语料的处理统称为语言标注。
莱曼(Lehmann,2004)详述了语言行间标注的发展。洪堡特(W. v. Humboldt,1836[1963]:534)最先在语言学著作中运用数字对应的标注方法帮助人们把有意义的元语言成分和对象语言中的语素相对应,他使用德语作为元语言解释古代Nahuatl语:
对象语言中的语素按从前到后的顺序编码,元语言中相对应的成分标出同样的编码,这样可以看出对象语言中第二个语素c-和元语言中第三个语素es是相对应的语素。
20世纪70年代,人们开始有意识地对语料进行标注,如艾伦(Allan,1977)对泰语的标注:
khru· lâ·j khon ‘teacher three person’
= ‘three teachers’
早期标注的特点是:格式上不采用上下对齐的方式,并且不区分词汇形式和功能性的范畴标记,比如上句中把表人的量词khon标注为“person”,使人无法辨识“person”是词汇意义还是语法属性。使用词汇意义来对译功能性语素是早期标注的一个特点。
标注语料最晚在20世纪80年代成为语言学著作中处理非写作语言语料的一个常规方法(Lehmann,2004)。但早期的标注无标准,格式常常不统一,把词汇性成分对应于功能性标记的现象很常见。最早关注标注问题的论著是莱曼(Lehmann,1982)。此后莱曼等(Lehmann et. al., 1994),莱曼(Lehmann,2004)等都尝试建立标注标准。由马普进化人类学研究所语言学系的科姆里(Bernard Comrie)和哈斯普马特(Martin Haspelmath)以及莱比锡大学语言学系比克尔(Balthasar Bickel)三人共同制定的莱比锡标注系统(The Leipzig Glossing Rules)是目前语言学界影响最大的标注规则,由10条规则和一个附录构成。10条规则规定了如何标注对象语言中的形态、句法、语义、语用等属性,附录展示了世界语言中常见的语法范畴标签及其缩写形式。
莱比锡规则是一个以英语作为元语言进行标注的规则,它采用三行标注模式:
第一行:以拉丁字母拼写的对象语言;
第二行:对词干语素和屈折语素进行逐个标注;
第三行:对对象语言的句子用英语进行自由翻译。
以Hatam语为例(Haspelmath, 2014):
‘Would you give it to me so that I can see it?’
语言标注可以服务于多种目的。
它可以服务于新兴的语言保存(language preservation)、语言存档(language archiving)和语言典藏(language documentation)学科,尤其是对濒危语言、新发现语言或陌生语言的调查、归类、整理和写作发表需要使用标注。
由于当代类型学大团队合作研究的需要,也出于研究者们共享所有语言样本的需要,每种语言的研究者或调查者都有必要对自己所研究的语言进行标注,以便非母语研究者能了解该语言的真实面貌。
参考书目:
Allan, Keith. Classifiers[J]. Language. 53, 1977.
Hudson, Richard. Towards a useful theory of language[M]. In Peter K. Austin, Oliver Bond & David Nathan (eds.) Proceedings of Conference on Language Documentation and Linguistic Theory. London: SOAS, 2007.
推荐链接:
Beermann, Dorothee & Pavel Mihaylov 2009 Interlinear glossing and its role in theoretical and descriptive studies of African and other lesser-documented languages. http://aclweb.org/anthology/W/W09/W09-0711.pdf. Comrie, Bernard & Martin Haspelmath & Balthasar Bickel 2008 Leipzig Glossing Rules. http://www.eva.mpg.de/lingua/resources/glossing-rules.php. Drude, Sebastian 2002. Advanced Glossing — a language documentation format and its implementation with Shoebox. http://www.mpi.nl/lrec/2002/papers/lrec-pap-10-ag.pdf. Haspelmath, Martin. 2014. The Leipzig Style Rules for Linguistics. http://www.academia.edu/7370927/The_Leipzig_Style_Rules_for_Linguistics. Lehmann, Christian. 2004 Interlinear morphemic glossing. http://www.uni- erfurt.de/sprachwissenschaft/personal/lehmann/CL_Publ/IMG.PDF. Loos,Eugene E. etc. Glossary of linguistic terms. http://www.sil.org/linguistics/GlossaryOfLinguisticTerms/contents.htm.相关阅读【大百科词条(稿)】目标域
【大百科词条(稿)】语言类型学
【大百科词条(稿)】格林伯格
【大百科词条(稿)】认知语言学
【大百科词条(稿)】否定类型
【大百科词条(稿)】类型学等级序列
【大百科词条(稿)】极性问类型
【大百科词条(稿)】形态类型指数
【大百科词条(稿)】语言采样
>>>中国社科院语言所网信室编辑
今日语言学
语言之妙 妙不可言
长按指纹,识别加关注