基于lucene的案例开发:案例初识

转载请注明出处: http://blog.csdn.net/xiaojimanman/article/details/43192055


      首先抱歉,这几天在准备案例的整体框架设计,所以更新就断了几天,还请原谅。



案例整体介绍
      在我们开始正式的案例开发介绍之前,我们先看一下整体的案例demo介绍,明白案例是做什么的。

      从上图中,我们可以看出,这个案例主要是通过爬虫程序去采集纵横小说上的资源,然后将资源存储到自己的数据库中,将数据库中的需要检索的数据通过lucene建立索引文件,最后通过web服务展示数据。这个过程中,我们需要编写爬虫(采集程序)、后台接口(数据库搜索&Lucene检索)、web前端展示三个部分。下面就对这三个部分将会使用的技术做简单的介绍。


web前端

      web前端将会基于BootStrap框架去做前端界面的设计,和后台的数据交互将通过JavaScript。通过初步设计,前端主要包括四个界面:首页(用作运营推广使用)、书籍列表页(用作关键词、标签、分类等检索结果展示)、简介页、阅读页,四个页面具体如下所示(这四个界面只是简单草图):


      首页将展示一些运营或推广数据,数据由运营人员编写。


      列表页主要用作书籍关键字、分类、标签、作者、状态等检索结果展示。


      简介页展示书籍的属性信息及展示章节列表信息。


      阅读页展示某一章节内容信息。



搜索后台
      搜索后台将主要基于lucene做信息检索,数据库将会使用mysql。搜索后台提供web前端展示需要的数据接口。
      
爬虫
      爬虫程序将基于HttpClient模拟浏览器行为,采集纵横小说网站内容(免费小说)。
      
      这篇博客主要对案例的整体做简单的介绍,知道这个案例是做什么的,不至于在后面的博客中不知道自己在做什么。
      
注:在开始介绍lucene搜索后台前,将会在几篇博客中,重点介绍搜索后台用到的工具类。虽然有些类在之前的博客中也有相关的介绍,但这里还是会对这些类再次的介绍,以免在后面的代码编写过程中,找不到一些方法或不知道方法是做什么用的。


ps:最近发现其他网站可能会对博客转载,上面并没有源链接,如想查看更多关于 基于lucene的案例开发点击这里。或访问网址http://blog.csdn.net/xiaojimanman/article/category/2841877
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值