人物关系抽取

人物关系抽取是实体关系抽取的一种情况。实际上是两个过程:命名实体识别和关系抽取。

一般情况下,是给定一个文本,要求找出其中的人物实体(姓名), 和它们之间的关系种类。需要判定的关系种类往往有很多种,需要判定是否是其中的一种,以及到底是哪一种。

一般情况下,都会有训练数据和测试数据,二者的格式和内容主题不会相差多远。

对于命名实体识别,可以使用CRF做,有工具可以调用;也可以使用汉语言处理包HanLP来完成。汉语言处理包HanLP具有Java接口,可以直接调用来完成命名实体的识别和句法分析。

关系抽取,关系的种类可能有很多种,而且彼此直接可能非常相似,因此具有一定的辨识难度,根据对训练数据的处理,可以对每一个关系种类建立一个等价类,认为文本中出现了其中的词语,则含有此类关系。如果文本中不包含所有等价类的词语,则认为不存在其中任意一种关系。等价类不宜太大,甚至可以直接采用关系种类的那个词语建立一个仅仅包含有一个词语的等价类,为了提高效果,可以进行不同程度的扩充,但是需要根据情况进行把握。



  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值