基于lucene的案例开发：案例初识

最新推荐文章于 2024-06-20 10:09:55 发布

xiaojimanman

最新推荐文章于 2024-06-20 10:09:55 发布

阅读量4k

点赞数 3

分类专栏： lucene Lucene案例开发文章标签： lucene 开发案例整体介绍 java

本文链接：https://blog.csdn.net/xiaojimanman/article/details/43192055

版权

lucene 同时被 2 个专栏收录

27 篇文章 3 订阅

订阅专栏

Lucene案例开发

27 篇文章 16 订阅

订阅专栏

转载请注明出处： http://blog.csdn.net/xiaojimanman/article/details/43192055

首先抱歉，这几天在准备案例的整体框架设计，所以更新就断了几天，还请原谅。

案例整体介绍
在我们开始正式的案例开发介绍之前，我们先看一下整体的案例demo介绍，明白案例是做什么的。

从上图中，我们可以看出，这个案例主要是通过爬虫程序去采集纵横小说上的资源，然后将资源存储到自己的数据库中，将数据库中的需要检索的数据通过lucene建立索引文件，最后通过web服务展示数据。这个过程中，我们需要编写爬虫（采集程序）、后台接口（数据库搜索&Lucene检索）、web前端展示三个部分。下面就对这三个部分将会使用的技术做简单的介绍。

web前端

web前端将会基于BootStrap框架去做前端界面的设计，和后台的数据交互将通过JavaScript。通过初步设计，前端主要包括四个界面：首页（用作运营推广使用）、书籍列表页（用作关键词、标签、分类等检索结果展示）、简介页、阅读页，四个页面具体如下所示（这四个界面只是简单草图）：

首页将展示一些运营或推广数据，数据由运营人员编写。

列表页主要用作书籍关键字、分类、标签、作者、状态等检索结果展示。

简介页展示书籍的属性信息及展示章节列表信息。

阅读页展示某一章节内容信息。

搜索后台
搜索后台将主要基于lucene做信息检索，数据库将会使用mysql。搜索后台提供web前端展示需要的数据接口。

爬虫
爬虫程序将基于HttpClient模拟浏览器行为，采集纵横小说网站内容（免费小说）。

这篇博客主要对案例的整体做简单的介绍，知道这个案例是做什么的，不至于在后面的博客中不知道自己在做什么。

注：在开始介绍lucene搜索后台前，将会在几篇博客中，重点介绍搜索后台用到的工具类。虽然有些类在之前的博客中也有相关的介绍，但这里还是会对这些类再次的介绍，以免在后面的代码编写过程中，找不到一些方法或不知道方法是做什么用的。

ps:最近发现其他网站可能会对博客转载，上面并没有源链接，如想查看更多关于基于lucene的案例开发请点击这里。或访问网址http://blog.csdn.net/xiaojimanman/article/category/2841877