Lucene
sunghosts
这个作者很懒,什么都没留下…
展开
-
Lucene-索引创建&搜索
索引其实就是目录,我们看书首先要看书的目录来了解这本书大概讲了什么。把索引创建的过程以写书来作个类比,以快速理解这个过程。 1:一篇文章包含标题和内容。 2:把多篇文章合在一起编纂成书。 3:这样就可以制作目录 创建索引的过程如下: 1:建立索引器IndexWriter 2:建立文档对象Document 3:建立信息字段Field(比如书的标题、内容) 4:将Field添原创 2015-04-19 14:17:22 · 357 阅读 · 0 评论 -
Lucene——解析PDF,word,excel
PDF 用到的java PDF类库是:PDFBox,下载后其中lib和externa文件夹下的jar文件需要引入项目 解析PDF思想: 1:PDDocument加载PDF文件 2:PDFTextScripper提取其中文本(getText()),返回一个String 2:PDFTextScripper将PDF文本写入一个输出流(write(PDDocument, Writer)),无返回原创 2015-04-25 19:50:07 · 1571 阅读 · 0 评论