1、语料库语言学是研究什么的学问?
研究自然语言机读文本(或称电子文本)的采集、存储、标注、检索、统计等方法的一门学问,其目的是通过对客观存在的大规模真实文本中的语言事实进行定量分析,为语言学研究或自然语言处理系统开发提供支持。
2、语料库语言学研究内容:
a)语料库的建设与编纂;b)语料库的加工和管理;c)语料库的应用,包括在语言学研究(言语、词汇和语义研究等)中的应用和在自然语言处理中的应用。
3、语料库的类型:
语种:单语种和多语种语料库。
记载媒体:单媒体和多媒体语料库。
地域:国家与国际语料库。
代表性和平衡性:平衡与平行语料库。
用途:通用与专用语料库。
分布时间:共时与历时语料库。
加工程度:生语料与标注语料库。
4、平行语料的两个含义:
a)在同一种语言的语料上的平行。-目的是对不同国家的(英语)进行对比研究。
b)两种或多种语言之间的平行采样和加工。-例如用于机器翻译中的双语对齐语料。