核心词库 用户词典 分词 词性 基于规则 基于角色 基于序列 隐马尔可夫 结构化感知机 随机条件场
一、核心概念
基本词性标注的作用仅限于单个 词 ,如果我们关注的是多个词构成的 复合词,例如 华北石油公司、米格-12PF等,词性的标注就无能为力了。在这种情况下,通常需要在分词和词性标注的结果之上,进行一次复合词的识别,这就称为 命名实体识别。
命名实体识别离不开标注语料库、设计特征模板、训练、评估准确率等一套机器学习流程。
+、标注语料库的方法
1、基于规则的命名实体识别
![请添加图片描述](https://i-blog.csdnimg.cn/blog_migrate/7300fdb65c3915718a07dbac686be7ec.jpeg)
2、基于角色标注的命名实体识别
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/f080895d4b273380c2b08bfed12e5f88.png)
3、基于序列标注的命名实体识别
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/a9ef86d8efb37d8d6b2ef251035bb36d.png)
+、总结
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/9e2f43a325a86fe1384e6b3a7914738c.png)