关系抽取工具浅析

1.Jiagu

思知(ownthink)开发的,对于百度百科文本,还能提取到部分三元组,抽取到的三元组有重复,有些比较奇怪,有些百科文本也提取不到任何三元组。其他文本就根本不行。

Jiagu可以同时抽取出实体和实体之间的关系。

2.DeepKE

关系抽取用到的模型有很多:BiLSTM、Capsule、GCN(先用工具提取出句子的语法树,构建出词语之间的邻接矩阵,然后用GCN。依赖语法树的准确性)、LM、CNN、Transformer

可以用自己的训练数据重新训练模型,上述几个模型可视为baseline,代码写的很好,调试也比较方便。

DeepKE是只包括关系预测。关系所涉及的实体需要自己输入,也就是需要自己做实体识别。

3.DeepDive

Deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 ,可以判断两个实体间是否存在指定关系。具有较强的灵活性,可以自己训练模型。有支持中文版的http://www.openkg.cn/tool/cn-deepdive

安装过程需要翻墙。使用金融交易数据作为训练数据,可以完成实体识别和关系抽取两步。

4.Reverb

Reverb是华盛顿大学Turing center研发的开放三元组抽取工具,可以从英文句子中抽取形如(augument1, relation, argument2)的三元组。它不需要提前指定关系,支持全网规模的信息抽取。目前用于华盛顿大学开发的knowitall知识库系统。

5.OLLIE

和Reverb类似,都是华盛顿大学研发的知识库KnowItAll的三元组抽取组件,OLLIE是第二代提取系统。Reverb的抽取建立在文本序列上,而OLLIE则支持基于语法依赖树的关系抽取,对于长线依赖效果更好。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值