【开源】基于Scrapy和Lucene实现一个深圳大学搜索引擎

#搜索引擎 by深圳大学

  1. 搜索引擎让人们平等便捷地获取信息,找到所求。

  2. 本项目的愿景是实现一个基于Scrapy和Lucene的个人搜索引擎,该搜索引擎的主要功能有:
    (1)爬虫抓取深圳大学公文通信息(数据来源需后期增加,目前只抓公文通),进行数据预处理,数据提取,分词,建立索引,当用户搜索相关信息时呈现准确的信息检索服务。
    (2)集成一些常用校内服务的入口,例如讲座,课程表,校园小巴实时位置等,扮演一个信息聚合的角色。

  3. 本项目采用了Python(Scrapy), Java(Lucene), PHP(ThinkPHP),分别对应了爬虫模块,索引模块,查询模块的功能实现,并实现了不同语言的功能模块间的接口通讯,接口间数据交换格式为Json文本。

  4. 本仓库包含索引模块和查询模块的源码,爬虫模块源码在另一个仓库:szu spider

##效果图

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值