如何对一个Document的不同Filed使用不同的分词器

如何对一个Document的不同Filed使用不同的分词器

 TonyLian 2010-01-25 

 

如题。

对于文章正文,希望使用中文分词器。

 

而用户在提交文件时让其输入的文章关键字,多个用空格分开,则希望使用WhitespaceAnalyzer进行分词并保存。

 

 

Java代码

doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));  

doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED)); 

 

doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));

doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));

 

引用 收藏 

 luckaway 2010-01-26

自己实现分词器! 研究下lucene相关的代码,还是蛮简单的! 引用 收藏 

 illu 2010-01-26

可以使用PerFieldAnalyzerWrapper

//默认为庖丁分词

PerFieldAnalyzerWrapper wrapper =

    new PerFieldAnalyzerWrapper(new PaodingAnalyzer());

//fieldName field名称

//analyzer  field对应分词器

wrapper.addAnalyzer(fieldName, analyzer); 引用 收藏 

 TonyLian 2010-01-26

illu 写道

可以使用PerFieldAnalyzerWrapper

//默认为庖丁分词

PerFieldAnalyzerWrapper wrapper =

    new PerFieldAnalyzerWrapper(new PaodingAnalyzer());

//fieldName field名称

//analyzer  field对应分词器

wrapper.addAnalyzer(fieldName, analyzer);

 

 

大开眼界呀!去研究一下

转自:http://lucene-group.group.iteye.com/group/topic/17513

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值