java继承:内存关系图

在这里插入图片描述

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
实现一个基于内存的英文全文检索搜索引擎,需要完成以下功能: 功能 1:将指定目录下的一批.txt 格式的文本文件扫描并在内存里建立倒排索引,这里面包含必须的子功能包括: 读取文本文件的内容; 将内容切分成一个个的单词; 过滤掉其中一些不需要的单词,例如数字、停用词(the, is and 这样的单词)、过短或过长的单词(例如长度小于 3 或长度大于 20 的单词); 利用 Java 的集合类在内存里建立过滤后剩下单词的倒排索引; 内存里建立好的索引对象可以序列化到文件,同时可以从文件里反序列化成内存里的索引对象; 可以在控制台输出索引的内容。 功能 2:基于构建好的索引,实现单个搜索关键词的全文检索,包含的子功能包括: 根据搜索关键词得到命中的结果集合; 可以计算每个命中的文档的得分,并根据文档得分对结果集排序; 在控制台显示命中的文档的详细信息,如文档的路径、文档内容、命中的关键词信息(如在文档里出现次数)、文档得分; 功能 3:基于构建好的索引,实现二个搜索关键词的全文检索。包含的子功能包括: 支持这二个关键词的与或查询。与关系必须返回同时包含这二个单词的文档集合,或关系返回包含这二个单词中的任何一个的文档集合; 可以计算每个命中的文档的得分,并根据文档得分对结果集排序; 在控制台显示命中的文档的详细信息,如文档的路径、文档内容、命中的关键词信息(如在文档里出现次数)、文档得分; 功能 4:基于构建好的索引,实现包含二个单词的短语检索,即这二个单词必须在作为短语文档里出现,它们的位置必须是相邻的。这个功能为进阶功能。 除了以上功能上的要求外,其他要求包括: 针对搜索引擎的倒排索引结构,已经定义好了创建索引和全文检索所需要的抽象类和接口。学生必须继承这些预定义的抽象类和和实现预定义接口来完成实验的功能,不能修改抽象类和接口里规定好的数据成员、抽象方法;也不能在预定义抽象类和接口里添加自己新的数据成员和方法。但是实现自己的子类和接口实现类则不作任何限定。 自己实现的抽象类子类和接口实现类里的关键代码必须加上注释,其中每个类、每个类里的公有方法要加上 Javadoc 注释,并自动生成 Java API 文档作为实验报告附件提交。 使用统一的测试文档集合、统一的搜索测试案例对代码进行功能测试,构建好的索引和基于统一的搜索测试案例的检索结果最后输出到文本文件里作为实验报告附件提交。 本实验只需要基于控制台实现,实验报告里需要提供运行时控制台输出截屏。 关于搜索引擎的倒排索引结构、相关的抽象类、接口定义、还有相关已经实现好的工具类会在单独的 PPT 文档里详细说明。同时也为学生提供了预定义抽象类和接口的 Java API 文档和 UML 模型

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值