Java、JSP搜索引擎语义排序的研究与实现

技术:Java、JSP
摘要:
为了适应网络信息的飞速增长,并且能够迅速、方便地从网络中获取有效信息, 搜索引擎逐渐走进了人们的生活,“飞梦”搜索引擎系统在这样的条件下,应运而生。本文首先系统的介绍了搜索引擎的概念、发展历史、和搜索引擎的分类。使读者能够初步了解搜索引擎技术。然后,详细介绍了“飞梦”搜索引擎系统。
“飞梦”搜索引擎是基于Web的搜索引擎。系统的前端以MVC模式来实现,Struts作为视图层,Spring做中间层,Hibernate作后端来开发实现的。本系统分为四个子模块,抓取模块实现的功能为:将web上的海量网页抓取到系统中,采用的实现方法是使用Heritrix来完成对网页的抓取。处理模块实现的功能为:解析网页,提取其中的有用内容,为网页建立词库,对解析网页生成的信息文件进行分词,并建立索引,将索引存入数据库中,采用的实现方法是:通过Lucene的API来实现对网页内容的建索,使用HTMLParser的API实现了对网页内容的解析。语义排序模块实现的主要功能是:对数据库中索引进行排序,通过核心排序算法实现语义排序,存于缓存中供用户查询。用户模块实现的主要功能是:用户模块是系统的用户接口,用户通过此模块完成与系统的交互,当用户在查询界面上输入要检索的信息后,系统将在可以接受的时间内,返回用户所需的结果集;采用DWR(Direct Web Remoting)封装了AJAX技术,处理用户请求; 
关键词:搜索引擎,Lucene,Heritrix,语义排序

目录:
1 引言    1 
2 课题背景    2
2.1搜索引擎的概念    2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值