Lucene Search(2)-filter,collector,querybuild

在本章,将要解决的核心问题是:
给定query,返回的结果文档必须包含查询词中的至少一个词。
试图通过构造booleanquery,手动编写collector。
下面先构造测试用例
query:yang wen jing
在索引中所有文档有:
doc1:yang yang
doc2:wen wen
doc3:jing jing
doc4: yang wen jing
doc5:no key words
那么输出结果是:1,2,3,4(此乃文档编号)

下面开始构造query(or and)
(1) 使用booleanquery每一个word的termquery用or连接。
(2)如果是and,booleanquery每一个word的termquery用and连接
这个函数可以完成上面的两个需求,轻松设置要满足query中的多少比例的查询词

在collector的继承中,改写collector函数。不使用评分函数,直接输出docid
在collector的collect函数,实现将符合要求的文档进行输出。在这里我们需要输出的是文档编号。用于后续评价。
(3)要实现float范围搜索
在search的时候写成如下格式便可以了
(4)使用IndexReader根据lucene中的文档编号提取相关信息

至此,我们就可以在python环境下编写相关代码了。
首先初始化Search类
然后重写了collecor类,将匹配上的文档放在了collector中,

在timestamp范围内的查询函数
其中的similarity的创建如下

至此,虽然没有完成,但是已经差不多写好了A组实验代码
在服务器上运行的时候,你会发现
用float的时候,这个range是不行的,不能加上后面的.0
这样可以运行
对子类初始化的时候,一定要初始化其父类
但是又出现这个问题
在search的时候报错了
又是参数错误,莫名其妙的
貌似是pylucene的问题,所以我就用java来写这部分程序吧
搜索过程没有问题,下面对结果进行部分抽检。将程序结果存放在txt文件中。然后抽查部分文档,使用工具检测其中是否含有关键字。
搜索结果出来了,Hour的持续时间是从2012-1-14到2012-1-31期间的数据
随机选择一个文档1326880859-9878bf9b7d0dc55916e57ec895664bf3,使用工具该文档的内容
可以知道检索的结果是正确的。是沉船相关的内容。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于计算机专业的学生而言,参加各类比赛能够带来多方面的益处,具体包括但不限于以下几点: 技能提升: 参与比赛促使学生深入学习和掌握计算机领域的专业知识与技能,如编程语言、算法设计、软件工程、网络安全等。 比赛通常涉及实际问题的解决,有助于将理论知识应用于实践中,增强问题解决能力。 实践经验: 大多数比赛都要求参赛者设计并实现解决方案,这提供了宝贵的动手操作机会,有助于积累项目经验。 实践经验对于计算机专业的学生尤为重要,因为雇主往往更青睐有实际项目背景的候选人。 团队合作: 许多比赛鼓励团队协作,这有助于培养学生的团队精神、沟通技巧和领导能力。 团队合作还能促进学生之间的知识共享和思维碰撞,有助于形成更全面的解决方案。 职业发展: 获奖经历可以显著增强简历的吸引力,为求职或继续深造提供有力支持。 某些比赛可能直接与企业合作,提供实习、工作机会或奖学金,为学生的职业生涯打开更多门路。 网络拓展: 比赛是结识同行业人才的好机会,可以帮助学生建立行业联系,这对于未来的职业发展非常重要。 奖金与荣誉: 许多比赛提供奖金或奖品,这不仅能给予学生经济上的奖励,还能增强其成就感和自信心。 荣誉证书或奖状可以证明学生的成就,对个人品牌建设有积极作用。 创新与研究: 参加比赛可以激发学生的创新思维,推动科研项目的开展,有时甚至能促成学术论文的发表。 个人成长: 在准备和参加比赛的过程中,学生将面临压力与挑战,这有助于培养良好的心理素质和抗压能力。 自我挑战和克服困难的经历对个人成长有着深远的影响。 综上所述,参加计算机领域的比赛对于学生来说是一个全面发展的平台,不仅可以提升专业技能,还能增强团队协作、沟通、解决问题的能力,并为未来的职业生涯奠定坚实的基础。
对于计算机专业的学生而言,参加各类比赛能够带来多方面的益处,具体包括但不限于以下几点: 技能提升: 参与比赛促使学生深入学习和掌握计算机领域的专业知识与技能,如编程语言、算法设计、软件工程、网络安全等。 比赛通常涉及实际问题的解决,有助于将理论知识应用于实践中,增强问题解决能力。 实践经验: 大多数比赛都要求参赛者设计并实现解决方案,这提供了宝贵的动手操作机会,有助于积累项目经验。 实践经验对于计算机专业的学生尤为重要,因为雇主往往更青睐有实际项目背景的候选人。 团队合作: 许多比赛鼓励团队协作,这有助于培养学生的团队精神、沟通技巧和领导能力。 团队合作还能促进学生之间的知识共享和思维碰撞,有助于形成更全面的解决方案。 职业发展: 获奖经历可以显著增强简历的吸引力,为求职或继续深造提供有力支持。 某些比赛可能直接与企业合作,提供实习、工作机会或奖学金,为学生的职业生涯打开更多门路。 网络拓展: 比赛是结识同行业人才的好机会,可以帮助学生建立行业联系,这对于未来的职业发展非常重要。 奖金与荣誉: 许多比赛提供奖金或奖品,这不仅能给予学生经济上的奖励,还能增强其成就感和自信心。 荣誉证书或奖状可以证明学生的成就,对个人品牌建设有积极作用。 创新与研究: 参加比赛可以激发学生的创新思维,推动科研项目的开展,有时甚至能促成学术论文的发表。 个人成长: 在准备和参加比赛的过程中,学生将面临压力与挑战,这有助于培养良好的心理素质和抗压能力。 自我挑战和克服困难的经历对个人成长有着深远的影响。 综上所述,参加计算机领域的比赛对于学生来说是一个全面发展的平台,不仅可以提升专业技能,还能增强团队协作、沟通、解决问题的能力,并为未来的职业生涯奠定坚实的基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值