首先需要的jar包
下载apache的lucene-core-3.6.2.jar,lucene-highlighter-3.6.2.jar,lucene-memory-3.6.2.jar,lucene-analyzers-3.6.2.jar和一个开源的工具包IKAnalyzer2012.jar。
版本一样要对应好IKAnalyzer2012之前的版本只支持到lucene3.3之前版本,版本最是坑爹啊。
如果需要使用xml配置,匹配单词和拦截单词时,必须使用相应的字符格式。
/**
* 相关的jar包
* lucene-core-3.6.2.jar,lucene-memory-3.6.2.jar,
* lucene-highlighter-3.6.2.jar,lucene-analyzers-3.6.2.jar
* IKAnalyzer2012.jar
*
* 截取一片文章中频繁出现的关键字,并给予分组排序(倒叙),以数组格式返回n个关键字
*
* 并该类内部含有一个List2Map方法,可将重复集合转换为Map格式
* 并算出该重复次数,放入相应的value中
*/
package com.gjz.get;
import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.uti