lucene2.9 分词结果展示

Set<String> set = new HashSet<String>(); set.add("爱"); StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_29,set); TokenStream stream = analyzer .tokenStream(null, new StringReader("我爱你,hello world")); while (true) { Token token = stream.next(); if (null == token) { break; } System.out.println(new String(token.termBuffer(),0,token.termLength()) + "/t/t 起始位置 " + token.startOffset() + " 结束位置" + token.startOffset()); }

我 起始位置 0 结束位置0
你 起始位置 2 结束位置2
hello 起始位置 4 结束位置4
world 起始位置 10 结束位置10

其中 “爱”作为分词 stopWords 被过滤掉了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值