Lucene与solr与elasticsearch总结

Lucene
开源的全文搜索引擎包,Hadoop创始人Doug Cutting,2000开发 - - 两周时间。
是开放源代码的全文检索引擎工具包,方便的嵌入到各种应用中,实现针对应用的全文索引/检索功能

特点:

稳定,索引性能高,对内存要求1MB栈内存
索引数据占整体索引文件约20%

引入依赖–6.0.0

<dependency> <!-- 查询相关jar包 -->
<groupId>org.apache.lucene</groupId>
<artifactId>lucene-queryparser</artifactId>
<version>6.0.0</version>
</dependency>
<dependency> <!-- lucene自带只能中文分词器jar包 -->
<groupId>org.apache.lucene</groupId>
<artifactId>lucene-analyzers-smartcn</artifactId>
<version>6.0.0</version>
</dependency>
<dependency> <!-- 测试用到的lucene工具包 -->
<groupId>org.apache.lucene</groupId>
<artifactId>lucene-analyzers-common</artifactId>
<version>6.0.0</version>
</dependency>
<dependency> <!-- 测试用到的lucene核心包 -->
<groupId>org.apache.lucene</groupId>
<artifactId>lucene-core</artifactId>
<version>6.0.0</version>
</dependency>

若为4.8.0版本依赖,见另一篇博文
lucene的分词:

Lucene的问题
不支持本地分布式
只支持java语言

Solr
将Lucene封装到一个应用中,对外提供http接口访问地址
localhost:8080/serach/index01—创建分布式index索引

elasticsearch:基于Lucene的搜索服务器,提供分部式的全文搜索引擎,实现对外http协议,基于restful web接口,Java开发。

elasticsearch特点:
自动维护数据的分布到多索引的建立,搜索请求分布到多节点的执行,自动维护数据的冗余副本,保证有机器宕机时不会数据丢失。
可以关闭索引,设置读写权限
index索引过来默认切成5份,分布式集群存为副本,存在本地,也可存储HDFS

关于Elasticsearch与Solor的比较总结:
1 都是基于Lucene,且安装都很简单
2 Solr利用Zookeeper进行分布式管理,而Elasticsearch自身带有分布式协调管理功能
3 Solr支持更多格式的数据,而Elasticsearch仅支持json格式
4 Solr官方提供功能较多,而Elasticsearch更注重核心功能,高级功能多由第三方插件提供
5 Solr在传统的搜索应用中表现好于Elasticsearch,但Elasticsearch在实时搜索应用中效率更高

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值