语义角色标注(Semantic Role Labeling,SRL)的使用范围很广泛,可以作为信息抽取(Information Extraction)、自动答复(Question Answering)、机器翻译(Machine Translation)的中间步骤。本篇博文将介绍 Zhou and Xu, 2015 的一篇论文,希望能对读者有所启发。
SRL的目标是找到给定句子里的谓词(predicate)相关的成分与此谓词的角色关系,被认为是一种监督学习问题(supervised machine learning)。传统方法中,比如逻辑回归(Logistics Regression,LR)、支持向量机(Supported Vector Machine,SVM)等线性分类器基于特征来完成此任务:
- 确定成分是否与谓词相关;
- 如果相关是何种关系类型?
在特征中,句法信息(syntactic information)被认为是必不可少的(Punyakanok etal., 2008a),因为成分在句法树(semantic tree)中的位置提供了中间的标