- 博客(2)
- 收藏
- 关注
转载 使用Lucene 3.0.0的结构遍历TokenStream的内容
以前版本的Lucene是用TokenStream.next()来遍历TokenStream的内容, 目前的版本稍微修改了一下, 使用下面的的一段程序可以遍历TokenStream的内容private staticvoid displayTokenStream(TokenStream ts) throws IOException{ TermAttribute termAtt =(Ter
2015-02-02 20:08:14 694
转载 详解庖丁解牛中文分词器工具的使用
今天在网上看了一篇关于中文分词的文章,有一类是关于基于字符串匹配的中文分词,里面谈到了一个“庖丁解牛分词器”,于是本人就想尝试跑跑这个分词工具。下面是具体的使用步骤:1. 从网上下载了一个庖丁解牛中文分词工具压缩包,放入D:\SoftwarePackage中。解压D:\SoftwarePackage中的paoding-analysis-2.0.4-beta压缩包到文件夹D:\software
2015-02-02 10:08:12 5887 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人