lucene2.9 分词结果展示

最新推荐文章于 2016-03-22 20:27:00 发布

iteye_4388

最新推荐文章于 2016-03-22 20:27:00 发布

阅读量84

点赞数

Set<String> set = new HashSet<String>(); set.add("爱"); StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_29,set); TokenStream stream = analyzer .tokenStream(null, new StringReader("我爱你,hello world")); while (true) { Token token = stream.next(); if (null == token) { break; } System.out.println(new String(token.termBuffer(),0,token.termLength()) + "/t/t 起始位置 " + token.startOffset() + " 结束位置" + token.startOffset()); }

我起始位置 0 结束位置0
你起始位置 2 结束位置2
hello 起始位置 4 结束位置4
world 起始位置 10 结束位置10

其中 “爱”作为分词 stopWords 被过滤掉了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iteye_4388

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lucene2.9 分词结果展示

Set&lt;String&gt; set = new HashSet&lt;String&gt;(); set.add("爱"); StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_29,set); TokenStream stream = analyzer .tokenStream(nul...
复制链接

扫一扫