核心词库 用户词典 分词 词性 基于规则 基于角色 基于序列 隐马尔可夫 结构化感知机 随机条件场
一、核心概念
基本词性标注的作用仅限于单个 词 ,如果我们关注的是多个词构成的 复合词,例如 华北石油公司、米格-12PF等,词性的标注就无能为力了。在这种情况下,通常需要在分词和词性标注的结果之上,进行一次复合词的识别,这就称为 命名实体识别。
命名实体识别离不开标注语料库、设计特征模板、训练、评估准确率等一套机器学习流程。
+、标注语料库的方法
1、基于规则的命名实体识别
2、基于角色标注的命名实体识别
3、基于序列标注的命名实体识别
+、总结