Elasticsearch--基于lucene的分布式搜索引擎

本文详细介绍了Elasticsearch,一个开源、高扩展的分布式全文检索引擎,用于存储和检索数据,其分布式特性使其在大规模数据处理上表现出色。文章对比了Elasticsearch与Solr,讨论了Elasticsearch的应用场景,如GitHub、维基百科等。此外,还涵盖了Elasticsearch的安装、启动、基本概念,以及如何使用Postman作为客户端进行接口测试。
摘要由CSDN通过智能技术生成

一、Elasticsearch简介

1. 什么是Elasticsearch

1)Elasticsearch,简称ES,是一个开源的高扩展的分布式全文检索和数据分析引擎。
2)Elasticsearch 可以近乎实时地存储和检索数据,其本身的扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。
3)Elasticsearch 使用Java开发并使用Lucene作为其核心来实现所有的索引和检索功能,通过简单的RESTfulAPI来隐藏Lucene的复杂性,从而使得全文检索变得简单易用。
4)总结:Elasticsearch 是一个开源的分布式、高扩展高实时、RESTful风格的搜索与数据分析引擎。 它的底层是开源库Apache Lucene。

2.Elasticsearch的应用案例

1) GitHub:2013 初,GitHub 弃用了 Solr,改用 Elasticsearch 来做 PB 级数据的搜索。
2) 维基百科:启动以 Elasticsearch 为基础的核心搜索架构。
3) SoundCloud:SoundCloud 使用 Elasticsearch 为 1.8 亿用户提供实时而精准的音乐搜索服务。
4) 百度:百度目前广泛使用 Elasticsearch 做文本数据分析,采集百度所有服务器上的各类指标数据及用户自定义数据,通过对各种数据进行多维度分析展示,辅助定位分析实例异常或业务层面异常。目前覆盖百度内部 20 多个业务线(包含 casio、云分析、网盟、预测、文库、直达号、钱包、风控…),单集群最大 100 台服务器,200 个Elasticsearch几点,每天导入 30TB 以上数据。
5) 新浪:使用 Elasticsearch 分析处理 32 亿条实时日志。
6) 阿里:使用 Elasticsearch 构建日志采集和分析体系。

3.Elasticsearch和Solr的对比

1)Solr利用Zookeeper进行分布式管理,而Elasticsearch自带分布式协调管理功能。
2)Solr支持多种格式的数据,而Elasticsearch仅支持json文件格式。
3)Solr官方提供的功能更多,而Elasticsearch更侧重于核心功能,其高级功能依赖于第三方插件。
4)Solr在传统的搜索应用中表现优于Elasticsearch,但在处理实时搜索应用时效率明显低于Elasticsearch。

二、Elasticsearch安装和启动

1.Elasticsearch的下载

网址:https://www.elastic.co/cn/downloads/elasticsearch

Elasticsearch 分为Windows和Linux版本,根据实际需要选择合适的版本。
学习阶段:选择方便安装与使用的Windows版本。
生产阶段:选择稳定安全的Linux版本。

其他版本下载:


2.Elasticsearch的安装

将下载好的Elasticsearch安装包解压到指定目录即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值