一、需求:给一个excel存储的立场语字典,用自然语言处理技术(NLP)进行扩展,得到一个更大的立场语字典。
实现代码:
核心知识点:用pandas包进行excel表的读写操作,用nltk包的wordnet包对表中单词数据进行分析处理,返回单词的同义词数据,整理成表存入新的excel表中。
扩展:
什么是NLP?
简单来说,自然语言处理(NLP)就是开发能够理解人类语言的应用程序或服务。处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
这里讨论一些自然语言处理(NLP)的实际应用例子,如语音识别、语音翻译、理解完整的句子、理解匹配词的同义词,以及生成语法正确完整句子和段落。