命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。
一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。
命名实体识别是作为分词的一个后续过程而存在的。
分词库:
- NLPIR 张华平博士
- THULAC 清华大学
- jieba分词
参考资料:
1、http://hanlp.linrunsoft.com/doc/_build/html/ner.html
2、http://thulac.thunlp.org/
3、http://ictclas.nlpir.org/