lucene3.02 的analyzer分析语汇单元

下面用代码展示 LUCENE自带的四种analyzer对相同文本分析结果的 异同

注:因为在2.9以后,lucene对语汇单元引入了一种新的机制。。。我用的资料是2006年的lucene in action,所以是老的代码。。。好悲哀。。。查了好多API,才用新的实现。。。

    A new TokenStream API has been introduced with Lucene 2.9. This API has moved from being Token-based to Attribute-based. While Token still exists in 2.9 as a convenience class, the preferred way to store the information of a Token is to use AttributeImpls.

 

下面是代码:

 

 不多解释,自行研究吧,呵呵

PS:如果要学习搜索引擎,我现在看的两本书是非常的好,一本是:Nutch+Lucene搜索引擎开发,教你如何起步配置搜索引擎,很详细,已成功,哈哈,另外一本就是:Lucene in action,有些比较专业的信息,想深入研究lucene必须要看,只是我买的这本是06年的,好悲哀。。。不知道有没有新版本。。。。

PS2:开源太他妈伟大了!!!

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值