搜索引擎的系统体系结构的研究与应用

技术:Java
摘要:
近年来,互联网上的信息呈几何级数爆炸性增长,丰富多彩的网络资源给人们的生活工作以及学习带来巨大方便的同时,信息的浩繁,庞杂无序和动态性又极大地影响了用户获取信息的速度,准确性和有效性。海量的存贮和科学的信息搜索是用户信息行为中两种重要的能力,互联网的发展已经实现了信息的海量存贮,为了解决大海捞针似的信息搜索问题,搜索引擎便应运而生了。目前搜索引擎技术已成为计算机工业界和学术界争相研究和开发的热点技术。
对于实现网络信息的海量搜索,搜索引擎的体系结构设计成为提高搜索效率的关键。本文中所设计的搜索引擎,主要有四个大的模块组成:一是抓取模块:实现了对网页信息的下载。二是索引模块:实现了对网页信息的排序,索引。三是搜索模块:实现了对网页信息的快速检索。四是用户接口:实现了系统的前台操作。
本系统是对网站数据及相关数据库数据进行搜索,管理配置了对应数据源和搜索途径,实现了对网络信息的快速搜索。
关键词:搜索引擎;体系结构;索引

目录:
引 言    1
第一章 搜索引擎的系统结构    2
1.1 结构概述    2
1.2 搜索引擎的的构成    2
1.2.1 网络机器人    2
1.2.2 索引与搜索    2
1.2.3 Web服务器    2
1.3 搜索引擎的主要指标及分析    2
第二章 系统设计的相关知识介绍    4
2.1 Lucene2.0简介    4
2.1.1 Lucene2.0的原理    4
2.1.2 Lucene2.0的优越性    4
2.2 JSP简介    5
2.2.1 JSP的运作模式    5
2.2.2 JSP的优点    5
2.3 JDBC简介    6
第三章 系统需求分析    8
3.1 编写目的    8
3.2 项目背景    8
3.3 任务概述    8
3.3.1 目标    8
3.3.2 运行环境    8
3.4 系统功能需求    8
3.4.1 网页抓取模块    9
3.4.2 索引模块    9
3.4.3 搜索    9
3.4.4 用户接口模块    10
第四章 系统详细设计    11
4.1 数据库设计    11
4.1.1 数据库需求分析    11
4.1.2 数据字典    11
4.2 系统设计    12
4.2.1 网页抓取    12
4.2.2 建立索引    13
4.2.3 搜索    14
4.2.4 前台设计    15
第五章 系统的实现    16
5.1 系统的实现    16
5.2 搜索测试    17
5.2.1 域名搜索测试    17
5.2.2 页面索引测试    18
5.3 重建数据库功能    20
结  论    21
参考文献    22
谢  辞    23

包含资料:
 

 

截图:
 

 
 

 
 

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值