solr 4.2近义词配置，使用的是IKAnalyzer2012FF_u1版本时无法实现近义词处理

最新推荐文章于 2020-05-29 15:37:46 发布

华夏勇者

最新推荐文章于 2020-05-29 15:37:46 发布

阅读量895

点赞数

分类专栏：搜索引擎文章标签： solr lucene

本文链接：https://blog.csdn.net/lehafafa/article/details/38865879

版权

搜索引擎专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最近要弄商品搜索近义词功能，比如输入商汞要搜到混泥土，我用的是solr4.2版本，网上转了一圈都没有我要的方案，也没有现成的类，

于是找到 lucene TokenFilterFactory类

但我用的是IKAnalyzer2012FF_u1版本其中分词只有

IKAnalyzer.class这个类，而近义词已工厂方式去处理，故在org.wltea.analyzer.lucene 包下加了个 IKTokenizerFactory主要是已工厂方式去处理

代码如下

package org.wltea.analyzer.lucene;

import java.io.Reader;
import java.util.Map;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.util.TokenizerFactory;

public class IKTokenizerFactory extends TokenizerFactory {

private boolean isMaxWordLength = false;

public void init(Map<String, String> args) {
String _arg = (String) args.get("isMaxWordLength");
this.isMaxWordLength = Boolean.parseBoolean(_arg);
}

public Tokenizer create(Reader reader) {
return new IKTokenizer(reader, isMaxWordLength());
}

public void setMaxWordLength(boolean isMaxWordLength) {
this.isMaxWordLength = isMaxWordLength;
}

public boolean isMaxWordLength() {
return this.isMaxWordLength;
}
}