(一)简介
1.定义
命名实体识别(Named Entity Recognition,NER)可以自动的从文本数据中识别出特定类型的命名实体。即在文本中标识命名实体并划分到相应的实体类型中,通常实体类型包括人名、地名、组织机构名、日期等。
举例说明,“当地时间 14 日下午,叙利亚一架军用直升机在阿勒坡西部乡村被一枚恶意飞弹击中。”这句话中包含的实体有:日期实体“14 日下午”、组织机构实体“叙利亚”、地名实体“ 阿勒坡西部乡村”、装备实体“军用直升机”和“飞弹”。
2.NER标签体系
在这里记录两种比较常用的NER的标签体系:BIO和BIOES。
1.BIO:
- B: begin,实体名称的开头字符。弱实体名称为单字,也是用这个符号。
- I:inside,实体名称的中间或末尾字符。
- O:outside,不是实体名称的字符。
2.BIOES:
- E:end,实体名称的结尾字符。
- S:single,单字成一个命名实体。
(二)研究进展
1.深度学习
随着深度学习不断发展,深度学习模型也开始广泛应