标注 | 英文说明 | 中文说明 |
ADJP | Adjective phrase | 形容词短语 |
ADVP | Adverbial phrase headed by AD | 由副词开头的副词短语,状语 |
CLP | Classifier phrase | 量词短语 |
CP | Clause headed by C | 由补语引导的补语从句,关系从句 |
DNP | Phrase formed by "XP+DEG" | XP + DEG 结构构成的短语 |
DP | Determiner phrase | 限定词短语 |
DVP | Phrase formed by "XP + DEV" | XP + DEV 结构构成的短语 |
FRAG | fragment | 片段 |
IP | Simple clause headed by I | 简单句 |
LCP | Phrase formed by "XP + LC" | 处所词为中心语的短语 |
LST | List marker | 用于解释说明性的列表标记短语 |
NP | Noun phrase | 名词短语 |
PP | Preposition phrase | 介词短语 |
PRN | Parenthetical | 插入语 |
QP | Quantifier phrase | 数词短语 |
UCP | unidentical coordination phrase | 非一致性并列短语 |
VP | Verb phrase |
|
并非所有的短语类型都能作为语义组块。其中 IP 和 CP 为简单句和从句语法块,改组块本质上是一个完整的句子。几乎所有的 CLP 都是 QP 的一个子集,FRAG 是由若干个词汇构成的一个集合,其不属于句子的范畴,不能作为组块来分析。LST 和 UCP 同样也不能作为语义组块分析。
因此,剩下的短语类型包括:ADJP / ADVP /DNP/ DP/ DVP/LCP/ NP/ PP /PRN/ QP / VP 这 11 种。
(1)NP:中心词为名词的短语
1.1 名-名复合词,连续的 NN 词性构成的复合词被括号括起来作为 NP ,通常来说最后一个 NN 是中心语。“纺织 | 工业”
1.2 词级并列结构,该名词复合结构由两部分组成,左侧为并列结构的名词短语,右侧为一个名词或符合名词。 NP-NP
“改革 |和| 解困方面”、 “能源、| 通信等城市基础设施”
1.3 由NR(专有名词)加上一个或多个 NN 组成的新的专有名词。“深圳 | 控股” “中国 | 机械工业部” “周 | 先生”
1.4 。。。。
(2)VP:以动词为中心的短语
2.1 复合动词搭配。 “开发 建设”
2.2 动趋词:“下降到 。。。”
2.3 动词 +体标记 “得” “坚持了” “ 意味着”
2.4 A 不 A A-A 以及变种 V 不 V V得V “能不能” “打不赢”
2.5 。。。。
(3)DP:限定词,一般用于修饰 NP 或者 限定 QP “任何” “全体”
(4)ADJP:形容词短语,由 JJ 投射得到 , “大型会议”,“若干规定”,“不完全统计”
(5)DNP:由多种类型的短语加上 (DEG)构成,它们总是出现在 NP 的上下文中。“张三 的/DEG 书” —DNP
(6)ADVP:副词短语 “努力/AD 参与/VV” —ADVP
(7)PP:介词短语 “仅在/P 一九九九年” —PP
(8)LCP:处所词为中心的短语 “传说/NN 中/LC” —LCP