java es 如何查询,如何在elasticsearch中获得查询的最大分数?

我有一个存储在elasticsearch索引中的大型文档集,我需要找到类似的文档集来排除重复项 .

不幸的是,这些文档可能有不同的值,所以我不能完全依赖过滤器 . 相反,我试图评估使用多个字段和不同提升值的两个文档之间的差异 .

如果差异太大,则文档不会计为重复 . 问题是 - 我不知道如何评估差异,因为搜索响应中的_score没有说明差异有多大 .

为每个特定查询获得最大可能得分是完美的 . 我怎样才能做到这一点?

Edit :例如,如果我执行这样的查询,则返回带有_score的JSON,大于1.00

请求:GET / documents / sometype / _search

{

"query": {

"bool": {

"should": [

{"match": {

"title": {

"query": "some title"

}

}}

]

}

}

}

响应示例:

{“take”:1,“timed_out”:false,“_ shards”:...,“hits”:{“total”:100,“max_score”:1.7588379,}}

正如文档所述,_score - 只是一个浮点数,对其范围一无所知 .

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值