本文旨在學習使用Stanford CoreNLP進行自然語言處理。
編程環境:64位win7系統,NetBeans,java要求1.8+
stanford-corenlp-full-2015-12-09.zip壓縮包。
Stanford CoreNLP功能:分詞(tokenize)、分句(ssplit)、詞性標注(pos)、詞形還原(lemma,中文沒有)、命名實體識別(ner)、語法解析(parse)、情感分析(sentiment)、指代消解(coreference resolution)等。
支持語言:中文、英文、法語、德語、西班牙語、阿拉伯語等。
具體使用:
1.在NetBeans中新建工程;
2.解壓stanford-corenlp-full-2015-12-09.zip,將下面的jar包導入工程庫中:
slf4j-api.jar
slf4j-simple.jar
stanford-corenlp-3.6.0.jar
stanford-corenlp-3.6.0-javadoc.jar
stanford-corenlp-3.6.0-models.jar
stanford-corenlp-3.6.0-sources.jar
xom.jar
3.新建如下代碼:
package corenlp;
/**
* 功能:練習使用CoreNLP,針對英文處理
* 時間:2016年4月22日 14:03:42
*
*/
import java.util.List;
import java.util.Map;