这几天一直在做Lucene6和Ansj配合使用的一个项目,现在想要针对分词进行过滤。在网上看了不少资料,大部分都比较老,
细看了很长时间的源代码,发现旧的FilterRecognition类被StopRecognition类所代替,而更早的版本是 FilterModifWord类。
代码段:
...
forest = new Forest();
StopRecognition s = new StopRecognition();
s.insertStopWords(",");
s.insertStopWords("能");
String str = "洁面仪配合洁面深层清洁毛孔,清洁鼻孔面膜碎觉使劲挤才能出一点点皱纹!";
System.out.println(NlpAnalysis.parse(str,forest).recognition(s));
下面是官方文档的说明,后来才发现的,然而如何配置lucene插件目前还在研究中