开源搜索引擎框架比较

概述

全文检索引擎,区别于结构化数据库检索(SQL),是以检索非结构化纯文本为目标的引擎。通过倒排结构高效检索文本。

 

目前业界最流行的 Solr 与 ElasticSearch(ES) 都是基于Lucene的搜索引擎框架。Lucene更像一个搜索引擎 Java API库,而Solr和ES在其上进一步封装扩展到Server级别。

 

比较

这篇文章写得较为全面:https://www.cnblogs.com/jajian/p/9801154.html

结论

ES 易用性更好:在分布式支持(不依赖zk内部集成支持分布式),监控报表丰富,简易版可以快速上手。

Solr基本已不推荐

 

Elasticsearch 的特点:

1) 不依赖于hadoop/yarn平台支持,自成平台,自己管理。

2) 2000万左右数据,4台机器,可承受每秒100qps左右查询压力。

3)不支持自定义排序,不支持自定义feature回传;只能设定各个域权重,利用内部的tfidf规则索引&排序(相当于index+query),可回传域(如title原串)在上层进一步rerank

4) 支持数值型、范围搜索,支持自定义求交规则,复杂表达式;

5)自成一套系统,简易

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值