汉语句法树库标注体系(TCT)

语料库的句法标注是语料库语言学研究的前沿课题,它的处理目标是对语料文本进行句法分析和标注,形成树库(tree bank)语料。

作为语料库多级加工过程中的一个中间阶段,句法分析和标注应该为进一步进行汉语句子的词语义项和语义关系标注提供有力的支持。理想情况下,在对句子进行正确句法信息标注的前提下,应能依据一个语义知识库和自动标注工具,准确地标注出大部分的语义信息。而要实现这个目标,就必须在这个阶段给出尽可能详细的句法信息描述。我们的基本设想是,对结构信息的完整描述,至少应包含以下内容:

1)  结构的外部功能特征描述:分析它进一步与其他结构相结合的能力;

2)  结构的内部组合关系描述:分析它内部的组成成分之间的语义组合关系;

3)  结构的语义中心词描述:分析它的语义中心词位置;

在汉语的绝大多数结构中,一般可以依据上面1)和2)的信息唯一地确定3)的位置。因此,在我们的标注体系中,主要对1)和2)两部分信息进行显性描述和标注。谓词,我们设计了一下两个标记集:成分标记集和关系标记集。


汉语成分标记集

汉语成分标记集
序号标记代码标记名称
1np名词短语
2tp时间短语
3sp空间短语
4vp动词短语
5ap形容词短语
6bp区别词短语
7dp副词短语
8pp介词短语
9mbar数量准短语
10mp数量短语
11dj单句句型
12fj复句句型
13zj整句
14jq句群
15dlc独立成分
16yj直接引语

句法关系标记集

句法关系标记集
序号标记代码标记名称
1ZW主谓结构
2PO述宾结构
3SB述补结构
4DZ定中结构
5ZZ状中结构
6LH联合结构
7LW连谓结构
8AD附加结构
9CD重叠结构
10JY兼语结构
11JB介宾结构
12FW方位结构
13KS框式结构
14BH标号结构
15SX顺序结构
16BL并列关系
17LG连贯关系
18DJ递进关系
19XZ选择关系
20YG因果关系
21MD目的关系
22JS假设关系
23TJ条件关系
24ZE转折关系
25JZ解注关系
26LS流水关系
27XX缺省关系



































评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值