命名实体识别(特征工程)

本文介绍了命名实体识别(NER)的重要性和应用,并详细阐述了三种常见的实体抽取方法:利用规则、投票模型和分类模型,尤其是特征工程的细节,如特征编码、离散型、连续性和ordinal特征的处理。
摘要由CSDN通过智能技术生成

命名实体识别也叫实体抽取是指从文本信息中抽取实体,这样的实体包括:人,地名等等。对于特定领域还要抽取特定的实体,比如医疗领域:药物,蛋白质,医院名称等等实体抽取在自然语言领域有着非常大的作用,是很多实现任务目标的基础,在知识图谱领域,实体抽取是首要任务,其次才是关系抽取,指代消解,实体统一和实体消解等任务的实现。

举个例子:假设我们在做智能对话系统:

\quad\quad 你好,请问北京到济南怎么走?

我们收到了这样的一句话首先要做的就是识别出“北京”,和“济南”是非常重要的,这样我们才能够根据问题进行回答。所以命名实体识别

不仅可以使用在问答系统中
像扩充原有知识库,
在法律金融等行业都有很大的用处

实体抽取我们常用的方法有三种:

1、利用规则

2、投票模型

3、利用分类模型:时序模型&#

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值