NLP中的一些术语积累

8 篇文章 1 订阅
3 篇文章 0 订阅
NLP中的一些术语积累
FesianXu 20210218 at Baidu intern

前言: 本文记录笔者在学习NLP过程中的一些术语笔记。


实体(entity)与命名实体(named entity)

这个概念其实来自于知识图谱(Knowledge Graph,KG)里面,笔者在阅读文献[1]的时候,有两个术语产生了一点困扰,即是entitynamed entity,后面笔者查到了其含义[2],笔记于此。

实体通常是一个很大的概念,一般指的是将某句话分解成若干个实体,比如:
Bob Dylan wrote Blowin’ in the Wind in 1962. 这句话中就有若干个实体,分别是Bob Dylan,一个歌手;Blowin’ in the Win,一首歌曲的名字。 然而这个不够准确,因为Bob Dylan作为实体,其类别应该是人/音乐家,而Blowin’ in the Win的实体类别应该是音乐名才对。因此,通常来说实体是一个很大而且很抽象的概念,我们通常把这些有具体名字的实体称之为命名实体。再举个例子,是一个实体,如果我给不同的人命名张三李四等等,那么后者就形成了命名实体,命名实体可以看成是实体的一个实例。

人类通过几种方法去判断实体:(1) 他们知道这个概念(比如纽约是城市实体的一个命名实体);(2)在某些语言里面,大写字母可能意味着实体,比如USA代表了美国;(3)从语义上下文里面猜测。 目前来说,通过NLP的方法去识别实体的问题称之为NER(Named Entity Recognition)问题。

Reference

[1]. Zhang, Z., Han, X., Liu, Z., Jiang, X., Sun, M., & Liu, Q. (2019). ERNIE: Enhanced language representation with informative entities. arXiv preprint arXiv:1905.07129.
[2]. https://www.quora.com/What-is-the-difference-between-an-Entity-and-Named-Entity-in-NLP

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FesianXu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值