Java面向主题的搜索引擎的设计

技术:Java
摘要:
Internet已经成为目前世界上最大的信息资源库,但是网上信息资源纷繁芜杂,如何满足人们对快速、准确而全面获取信息的要求,已经成为摆在人们面前的一大难题。基于Internet的各类搜索引擎应运而生并得到了迅速发展。面向主题的搜索引擎是一种分类细致精确、更新及时的搜索引擎。随着Internet信息的爆炸增长以及信息多元化的发展,主题搜索引擎正成为研究热点与发展趋势。
本课题就面向主题搜索引擎的关键技术进行了研究,并提出了一种基于Lucene的面向主题搜索引擎的解决方案。在本课题的条件下提出了面向服装主题的搜索引擎的设计思想、系统结构、搜索策略和搜索方式等。
系统的实现技术主要是按照后台和前台来分的,在后台的设计中主要应用的技术有Luence和Heritrix;在前台的设计中主要是使用了MVC(Model View Controller)的设计模式和Struts框架以及Hibernate等技术。
关键词:搜索引擎;主题;Luence

目录:
引 言    1
第一章 面向主题搜索引擎概述    2
1.1 搜索引擎的概念和发展现状    2
1.2 面向主题搜索引擎的发展趋势    2
1.3 小结    3
第二章 面向服装行业搜索引擎的简介    4
2.1 设计思想    4
2.2 系统体系结构和流程    4
2.3 小结    6
第三章 系统涉及的相关技术以及功能需求    7
3.1 系统设计的相关技术    7
3.1.1 Luence索引的建立    7
3.1.2 网络爬虫技术    9
3.1.3 解析网页技术    10
3.2 系统功能需求    10
3.2.1 网页信息抓取模块    12
3.2.2 网页解析模块    12
3.2.3 建立索引模块    13
3.2.4 关键词词库过滤模块    13
3.2.5 用户接口模块    13
3.3 小结    14
第四章 系统数据库设计和详细设计    15
4.1 数据库设计    15
4.1.1 数据库需求分析    15
4.1.2 数据字典    15
4.1.3 数据库模型设计    16
4.2 系统详细设计    17
4.2.1 网络爬虫流程设计    17
4.2.2 解析Html文件    18
4.2.3 创建索引    19
4.2.4 使用关键词词库过滤索引文件    19
4.2.5 网站前端设计    20
4.2 小结    22
第五章 系统实现    23
5.1 系统功能实现    23
5.1.1 系统后台功能实现    23
5.1.2 系统前台功能实现    24
5.2 小结    26
结  论    27
参考文献    28
谢  辞    29

 

 


 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值