解决的问题:
由于公司有上千个文档,如WORD、EXCEL、PPT等,目前存放都是以文件系统的方法,就是用SVN进行管理,用目录存放,非常不方便查找文件。
那么,结合网上找到一些朋友写的算法,然后在此基础上进行了补充:可以通过要查找的内容,来得到符合条件的文件。
一、使用顺序:
1、首先配置索引存放目录,默认是:D:\\doc\\index,如果没创建目录,程序会自动创建:Constants.DIRECTORY_INDEX_PATH
2、指定要搜索的文件所在目录:Constants.DIRECTORY_FILE_PATH
3、创建索引:运行 Indexer.java 中的main方法
4、开始查找内容:运行 Searcher.java 的main方法
A、支持office2003-2010的EXCEL、WORD、PPT查找,并还支持PDF
B、创建索引时,支持文件递归查找
C、支持屏蔽指定目录创建索引,如有些目录不想加进来
D、支持目录查找
二、存在问题
1、待支持的文件类型,如:TXT、SQL、VISIO等,大家有空可以继续扩展,前2个很简单
2、文件查找算法存在一些问题:Searcher.java searcher方法,有些搜索词不能查出来,如提供的测试文件:51CTO下载-ORACLE__SQL语句教学.pdf,
搜索内容:子查询使用主查询的数据
源代码地址:
[url]http://ishare.iask.sina.com.cn/f/69219507.html[/url]
由于公司有上千个文档,如WORD、EXCEL、PPT等,目前存放都是以文件系统的方法,就是用SVN进行管理,用目录存放,非常不方便查找文件。
那么,结合网上找到一些朋友写的算法,然后在此基础上进行了补充:可以通过要查找的内容,来得到符合条件的文件。
一、使用顺序:
1、首先配置索引存放目录,默认是:D:\\doc\\index,如果没创建目录,程序会自动创建:Constants.DIRECTORY_INDEX_PATH
2、指定要搜索的文件所在目录:Constants.DIRECTORY_FILE_PATH
3、创建索引:运行 Indexer.java 中的main方法
4、开始查找内容:运行 Searcher.java 的main方法
A、支持office2003-2010的EXCEL、WORD、PPT查找,并还支持PDF
B、创建索引时,支持文件递归查找
C、支持屏蔽指定目录创建索引,如有些目录不想加进来
D、支持目录查找
二、存在问题
1、待支持的文件类型,如:TXT、SQL、VISIO等,大家有空可以继续扩展,前2个很简单
2、文件查找算法存在一些问题:Searcher.java searcher方法,有些搜索词不能查出来,如提供的测试文件:51CTO下载-ORACLE__SQL语句教学.pdf,
搜索内容:子查询使用主查询的数据
源代码地址:
[url]http://ishare.iask.sina.com.cn/f/69219507.html[/url]