1、准备工作
打开PanGu4Lucene\WebDemo\Bin,将Dictionaries添加到项目bin目录下(改名为Dict),添加对PanGu.dll(同目录下不要有Pangu.xml,那个默认的配置文件的选项对于分词结果有很多无用信息)、PanGu.Lucene.Analyzer.dll的引用
2、使用
PanGuAnalyzer analyzer = new PanGuAnalyzer();
TokenStream tokenStream = analyzer.TokenStream("", new StringReader("被分词的字符串"));
Lucene.Net.Analysis.Token token = null;
while ((token = tokenStream.Next()) != null)
{
token.TermText(); //获取分词后的词
}