1 Luke简介Luke是一个方便宜的开发和诊断工具,它能访问Lucene建立好的索引同时也允许以如下的一些方式展示和修改内容: l 按文档(Document)号或者词项浏览 l 查看文件/复制到粘贴板 l 查询一个高频词项排序列表 l 执行查询并查看结果 l 分析查询结果 l 选择性地从索引中删除文档 |
l 重建修改原始文档域,重新插入索引中
l 优化索引
近期的一些Luke版本可以通过插件或者脚本进行扩展。
2 Luke安装及使用
1、首先配置好JAVA环境。
2、下载luke:http://www.getopt.org/luke/luke-0.9.2/lukeall-0.9.2.jar。
3、双击lukeall-0.9.2.jar。
4、选择索引文件查看。
另外,Luke的plugin中带了一个Analyzer的测试工具。
在Luke中选择plugins标签,再选择Analyzer Tool,就可以使用这个测试Analyzer的工具了。在下拉列表中选择要测试的Analyzer,然后输入要分析的文本,点Analyze,就可以看到分析出来的token了。这个工具可以测试很多analyzer,除了最基本的WhitespaceAnalyzer、StopAnalyzer、SimpleAnalyzer、StandardAnalyzer之外还可以实验KeywordAnalyzer、SnowballAnalyzer、CJKAnalyzer、ChineseAnalyzer等等,可以说是包罗万象了。
写索引和搜索程序之前,都可以用这个工具来比较一下各种Analyzer的运行结果。另外估计如果把自己写的Analyzer编译后加入Luke的jar包的相应位置中,应该也可以测试自己的Analyzer类了。
图表 1 选择索引文件夹
图表 3 查看文档
图表 4 查询分析