- 博客(8)
- 资源 (6)
- 收藏
- 关注
原创 java 抽取word,excel,pdf
很多人问到如何抽取word,excel,pdf阿。这里我总结一下抽取word,pdf的几种方法。1。用jacob.其实jacob是一个bridage,连接java和com或者win32函数的一个中间件,jacob并不能直接抽取word,excel等文件,需要自己写dll哦,不过已经有为你写好的了,就是jacob的作者一并提供了。jacob下载: http://www.java-cn.com/tec
2008-08-19 17:04:00 300
原创 lucene 高亮显示
package src;import java.io.StringReader;import java.util.Date;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.SimpleAnalyzer;import org.apache.lucene.analysis.Toke
2008-08-19 14:02:00 566
转载 为什么说Lucene不好
引言在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。 在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并且仍然是开源j
2008-08-19 13:59:00 544
转载 lucene数据源
lucene不管数据来源是什么格式,只要它能被转化为文字的形式,就可以被lucene分析利用,对其进行索引和搜索.简单地说,lucene可以对任何的数据做索引和搜索,不管文件是Word,pdf格式,只要可以从中抽取文字形式的内容就可以被lucene利用啦
2008-08-19 13:50:00 349
原创 Lucence Resource
在应用中加入全文检索功能——基于Java的全文索引引擎Lucene简介http://www.chedong.com/tech/lucene.htmlApache Lucenehttp://lucene.apache.org/java/docs/index.html Java开源全文检索http://www.open-open.com/32.htm
2008-08-19 13:46:00 324
原创 lucence实现中文检索(建立索引)
以下程序需要lucene-core-2.0.0.jarimport org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.demo.FileDocument;import org.apache.lucene.index.IndexWriter;import java.io.Fi
2008-08-19 13:45:00 544
原创 新一篇: lucene学习----创建索引 |
Lucene学习笔记一、环境需要导入lucene.jar包(在lucene.apache.org下载)二、基本概念1.Lucene的工作流程:(1) 使用IndexWriter,在指定的目录建立索引的文件 (2) 将需要检索的数据转换位Document的Filed对象,然后将Document用IndexWriter添加倒索引的文件中 (3) 处理索引信息,关闭IndexW
2008-08-19 11:54:00 359
原创 基于Lucene/XML的站内全文检索解决方案:WebLucene
内容摘要:为Lucene做一个通用XML接口一直是我最大的心愿:更方便的在WEB应用中嵌入全文检索功能提供了XML的数据输入接口:适合将原有基于各种数据库的数据源导入到全文索引中,保证了数据源的平台无关性; 通过了基于XML的搜索结果输出:方便了通过XSLT进行前台的结果显示; MySQL /
2008-08-19 11:53:00 276
Spring 3 Professional Apress
2013-01-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人