- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 lucene测试IKAnalyzer分词器和读取txt文件方法
package test; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.
2012-03-27 10:43:06 2056
转载 java读取pdf文件内容
import java.io.File; import java.io.FileOutputStream; import java.io.OutputStreamWriter; import java.io.Writer; import java.net.MalformedURLException; import java.net.URL;
2012-03-02 17:48:35 6803 3
转载 读取扫描版的Pdf文件 如何修改扫描版的pdf文件
文章简介PDF 是 Adobe 便携式文档格式(Portable Document Format)的简称,PDF 以“文本+图像”的格式,保留了原文件的细节信息,如:字体格式,版式和图片色彩等,且质量清晰、容量较小、可以多页合成一个文件,所以非常适宜网上传输,公司内部共享。由于 PDF 格式是 Adobe 公司开发的,所以经常用 Acrobat Reader 或 Acrobat 软件打开,但无论是
2012-03-02 17:00:43 6991
转载 lucene全文检索概述 简介 整体知识
一,信息检索的过程简介 全文检索和数据库应用最大的不同在于:让最相关的头100条结果满足98%以上用户的需求 1,构建文本库 在开发功能前,一个信息检索系统需要做些准备工作,首先,必须要构建一个文本数据库,这个文本数据库用来保存所有用户可能检索的信息。在这些信息的基础上,确定索引中 的文本类型,文本类型是被系统所认可的一种信息格式,这种格式应当具有可识别,冗余程度低的特点。一旦文本模型
2012-03-02 14:24:34 951
java webservice axis2 通过 js javascript 调用webservice
2011-11-03
ext gridpanel多层表头分组小计导出excel与Java后台交互全代码
2010-10-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人