**
Chu-Liu Edmonds算法在带权重的有向图中寻找最大生成树
**
基于图的依存句法分析(Graph-Based Dependency Parsing)
前几天读的J&M的第三版Speech and Language Processing时在依存分析这一章看到上述算法,无奈对于此算法的中文解析实在太少于是硬着头皮啃完原著,写下自己的理解,错误之处敬请指出。
此算法是一种高效的贪心算法,用于在有向图中寻找最优的生成树。准备地说,该算法用于一个全连接的、带权重的有向图中。给定一个句子,图中的顶点是句子中的单词,边是所有可能的head-dependent分配,边的权重的大小是head-dependent关系的分数。还有一个ROOT节点,指向所有其他节点。算法返回一棵从ROOT节点传出的最大生成树,代表此句子的依存分析。步骤如下:
- 对于所有的顶点,找到入边(incoming edge)最大的那个边,如果能产生一颗生成树算法结束否则继续下一步。形式地,对于全连接的图 G = <V, E>,子图 T = <V, F> 是G的一颗生成树,如果T 中无环并且除了ROOT节点之外其他节点只有一条入边;
- 经过第一步很可能会出现带环的子图,Chu and Liu and Edmonds独立地找到了一种优雅的方法消除环:对于顶点的入边,用权值最大的边减去所有入边的权值,这样所有在第一步中被选中的边的权值都变成0,包括环中的边&