(刚开始接触,测试了一些Demo,写在博客上防止遗忘,如果错了,那就错了。0菜鸟先飞0)
开源工具lingpipe基本涵盖了NLP的很多领域,包含的算法也很多也有相应的论文,最厉害的是它支持中文处理,测试了一个sentiment Analyse的demo,精度大概能达到80%左右。lingpipe首页提供了工具的下载,直接下载下来以后,可以导入到eclipse。
配置步骤:
1,eclipse选择new--java project--other--Java Project from Existing Ant Buildfile。
2,选中lingpipe-4.1.0---demos---tutorial---sentiment---bulid.xml
3,还需要build path --libraries--add external jar --lib文件夹下的.jar文件
测试过程:
lingpipe 官方提供了测试的Demo。共有4个,包括基本极性分析,polarity Basic.java。主客观句识别 sujectivitybasic.java。
在原代码的基础上,添加 了一个情感词库,该情感词库包含情感得分,可以判断正负极性。
代码(修改版,测试句子的正负性,添加一个情感词典。):
import com.aliasi.util.Files;
import com.test.Sentiment.TestSentiment1;
import com.test.Sentiment.TrainSentiment;
import com.aliasi.classify.Classification;
import com.aliasi.classify.Classified;
import com.aliasi.classify.DynamicLMClassifier;
import com.aliasi.lm.NGramProcessLM;
import java.io.File;
import java.io.IOException;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.SQLException;
import java.util.Iterator;
import java.util.