老紫竹的专栏

享受Java的快乐每一天之我的大数据生活

老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)

 老紫竹网页采集系统(LzzSearch)变更历史
===================================

2009-02-03 v0.2
------------------------
* 增加了对Lucene 2.4 的支持,保存采集内容并对提供搜索和内容更新
* 使用了庖丁解牛做中文分词
* 修正了 StrTools 里面对于<br />不能正确文本替换的BUG
* 增加了专用的TestLucene的演示程序
* 更改test目录名为demo
* 的Lucene的索引目录在applicationContext.xml里面进行修改,默认为 d:/indexpaoding/lzzSearch
* 调整了项目目录,将需要的5个jar都放到了项目内部,无需单独下载了
* 注意:庖丁所需要的dic我已经放到了系统内部,在src/dic下面
     并且更新了paroding-analysis.jar里面的 paoding-dic-home.properties文件的配置


2009-02-02 v0.1
------------------------
* 基于Spring的配置,可以轻松的增加采集的站点
* 采集点包含标题,作者,发布时间和内容四部分
* 采集后的内容由用户自行

 

 

下载与反馈地址:

老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)

 

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/java2000_net/article/details/3860571
文章标签: lucene spring jar
个人分类: 跟老紫竹学Java
想对作者说点什么? 我来说一句

开发者 1 资源0.2

2011年09月03日 7.2MB 下载

clumsy-0.2-win64 位

2016年09月21日 330KB 下载

没有更多推荐了,返回首页

不良信息举报

老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭