近期需要学习一些命名实体识别的知识,记录一下,以便以后复习
个人理解
目前的理解是,命名实体识别(NER),是自然语言处理(NLP)的一个阶段,可应用于机器翻译、摘要形成、信息检索等等,个人认为,自然语言处理是一门很复杂的跨学科技术,其难点在于人类是富有思维的,人的语言寄托人的思想,因此很难准确处理。但其实转念一想,人工智能不正是模拟人的思维吗,如果用神经网络的只是来看,完全分析出语言所富有的思维是不是完全可能呢?
相对于复杂的语句,命名实体识别作用在于提炼句中实体,因此难度较低。但是语句的含义通常可由句中实体进行推导联想而得到其含义。(表达较混乱,逻辑需进一步清理╮(╯▽╰)╭)
相关资料
主要参考了stanford NLP,以及fudanNLP
其中stanford NLP中对于中文处理效果一般,特点应该是中文,但可参考其思想
在fudanNLP中,简单试了一下,效果还不错,NER的实现是通过分析、词性定义实现的命名实体识别。等待进一步深入研究
相关学习网站:http://www.52nlp.cn/
待续。。。