java文本检索pdf,pdfsearch pdf文件的关键字搜索引擎,采用lucene,pdfbox等技术实现的 Jsp/Servlet 256万源代码下载- www.pudn.com...

文件名称: pdfsearch891ea1e7dab975064c6bfd22796603ae.gif下载  收藏√  [443d104427974206832dc4b12407db70.gif

 5  4  3  2  1 fb9128a58cbeaabbeb3718ed75079ccf.gif]

开发工具: Java

文件大小: 22284 KB

上传时间: 2013-04-07

下载次数: 8

提 供 者: mengyu

详细说明:pdf文件的关键字搜索引擎,采用lucene,pdfbox等技术实现的-pdf file keyword search engine, lucene, pdfbox technology

文件列表(点击判断是否您需要的文件,如果是垃圾请在下面评价投诉):

index\META-INF\MANIFEST.MF

.....\WEB-INF\classes\test\servlet1.class

.....\.......\.......\....\servletpath.class

.....\.......\lib\commons-io-2.4.jar

.....\.......\...\commons-logging-1.0.4.jar

.....\.......\...\fontbox-1.7.1.jar

.....\.......\...\lucene-analyzers-3.6.2.jar

.....\.......\...\lucene-core-3.6.2.jar

.....\.......\...\lucene-kuromoji-3.6.2.jar

.....\.......\...\PDFBox-0.7.3.jar

.....\.......\...\jsf-impl.jar

.....\.......\...\jsf-api.jar

.....\.......\...\jstl-1.2.jar

.....\.......\...\fontbox-0.1.0.jar

.....\.......\web.xml

.....\index.jsp

.....\.project

.....\.mymetadata

.....\.classpath

.....\lib\PDFBox-0.7.3.jar

.....\...\commons-io-2.4.jar

.....\...\commons-logging-1.0.4.jar

.....\...\fontbox-1.7.1.jar

.....\...\lucene-analyzers-3.6.2.jar

.....\...\lucene-core-3.6.2.jar

.....\...\lucene-kuromoji-3.6.2.jar

.....\...\fontbox-0.1.0.jar

.....\.settings\org.eclipse.jdt.core.prefs

.....\.........\.jsdtscope

.....\.........\org.eclipse.wst.jsdt.ui.superType.name

.....\.........\org.eclipse.wst.jsdt.ui.superType.container

.....\WebRoot\index.jsp

.....\.......\META-INF\MANIFEST.MF

.....\.......\WEB-INF\web.xml

.....\.......\.......\classes\test\servletpath.class

.....\.......\.......\.......\....\servlet1.class

.....\src\test\servlet1.java

.....\...\....\servletpath.java

.....\WebRoot\WEB-INF\classes\test

.....\.EB-INF\classes\test

.....\.ebRoot\WEB-INF\classes

.....\.......\.......\lib

.....\.EB-INF\classes

.....\.......\lib

.....\.ebRoot\META-INF

.....\.......\WEB-INF

.....\src\test

.....\META-INF

.....\WEB-INF

.....\lib

.....\pdftxt

.....\pdf

.....\index04

.....\.settings

.....\.myeclipse

.....\WebRoot

.....\src

index

输入关键字,在本站256万海量源码库中尽情搜索:

帮助

[Spdf.rar] - 用java和JSP是实现PDF文件的分页和在web上的查询你输入的一页或者任意几页PDF的功能。

阅读终点,创作起航,您可以撰写心得或摘录文章要点写篇博文。去创作
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,以下是一个简单的Java代码示例,用于实现一个基于Lucene的全文搜索引擎: ```java import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.StringField; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.IndexWriterConfig; import org.apache.lucene.index.IndexableField; import org.apache.lucene.queryparser.classic.ParseException; import org.apache.lucene.queryparser.classic.QueryParser; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; import org.apache.lucene.store.RAMDirectory; public class SimpleSearchEngine { public static void main(String[] args) throws IOException, ParseException { // 创建一个内存索引库 Directory indexDirectory = new RAMDirectory(); // 创建一个索引写入器 IndexWriterConfig config = new IndexWriterConfig(new StandardAnalyzer()); IndexWriter writer = new IndexWriter(indexDirectory, config); // 添加一些文档到索引库中 addDocument(writer, "1", "Lucene is a full-text search engine library in Java."); addDocument(writer, "2", "It is very fast and highly scalable."); addDocument(writer, "3", "Lucene provides advanced features like fuzzy search and proximity search."); // 关闭索引写入器 writer.close(); // 创建一个查询器 IndexSearcher searcher = new IndexSearcher(indexDirectory); QueryParser parser = new QueryParser("content", new StandardAnalyzer()); // 搜索文档 Query query = parser.parse("full-text search"); TopDocs results = searcher.search(query, 10); // 输出搜索结果 System.out.println("Total hits: " + results.totalHits); for (ScoreDoc hit : results.scoreDocs) { Document document = searcher.doc(hit.doc); System.out.println(document.get("id") + " " + document.get("content")); } // 关闭查询器和索引库 searcher.getIndexReader().close(); indexDirectory.close(); } // 添加文档到索引库中 private static void addDocument(IndexWriter writer, String id, String content) throws IOException { Document document = new Document(); IndexableField idField = new StringField("id", id, Field.Store.YES); IndexableField contentField = new StringField("content", content, Field.Store.YES); document.add(idField); document.add(contentField); writer.addDocument(document); } } ``` 这个示例创建一个内存索引库,并添加三个文档到索引库中,然后搜索包含“full-text search”关键词的文档,并输出搜索结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值