依存句法分析待后续继续学习补充(自用)

依存句法分析

1.

  • 目标是分析句子的语法结构并将其表示为容易理解的结构(通常是树形结构)。

2. 短语结构树

短语结构语法 上下文无关文法

3.依存句法树

  • 词与词之间存在主从关系。
  • 二元不等价的关系。
  • 在句子中,如果一个词修饰另一个词,则称修饰词为从属词( dependent ),被修饰的词语称为支配词(head),两者之间的语法关系称为依存关系( dependency relation)。
  • 箭头方向由支配词指向从属词。
  • 将一个句子中所有词语的依存关系以有向边的形式表示出来,就会得到一棵树,称为依存句法树( dependency parse tree)。
  • 现代依存语法中,语言学家 Robinson 对依存句法树提了 4 个约束性的公理。
    • 有且只有一个词语(ROOT,虚拟根节点,简称虚根)不依存于其他词语。
    • 除此之外所有单词必须依存于其他单词。
    • 每个单词不能依存于多个单词。
    • 如果单词 A 依存于 B,那么位置处于 A 和 B 之间的单词 C 只能依存于 A、B 或 AB 之间的单词。
    • 这 4 条公理分别约束了依存句法树(图的特例)的根节点唯一性、 连通、无环和投射性( projective )。这些约束对语料库的标注以及依存句法分析器的设计奠定了基础。
中文依存句法树库
  • 目前最有名的开源自由的依存树库当属UD ( Universal Dependencies)

  • 选取其中规模最大的 UD_ Chinese GSD 作为示例

  • http://file.hankcs.com/corpus/chs-gsd-ud.zip

  • 该树库的格式为 CoNLL-U,这是一种以制表符分隔的表格格式。CoNLL-U 文件有10列,每行都是一个单词, 空白行表示句子结束。单元中的下划线 _ 表示空白, 结合其中一句样例,解释如表所示。

  • 可视化:工具如下:

    • 南京大学汤光超开发的 Dependency Viewer。导入 .conll 扩展名的树库文件即可。
    • brat 标注工具。

    可视化工具可以帮助我们理解句法树的结构,比较句子之间的不同。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值