目录
1、es的前世今生
Lucene 是最先进的,功能最强大的搜索库,但是直接基于Lucene开发十分复杂,api非常复杂,体现在实现一个简单的功能要实现大量的代码,而且需要我们深入理解其底层原理,比如各种索引结构等;
ElasticSearch : 基于Lucene进行封装,一定程度上隐藏了复杂性,提供了简单的api接口,如Java Api restful Api等;
- 分布式文档存储引擎
- 分布式的搜索引擎和分析引擎
- 分布式,支持PB级别的数据近实时处理
- 开箱即用,优秀的默认参数,不需要任何额外的设置,完全开源
ElasticSearch的来源故事还是很有趣的,大家可以网上search一波。
2、es的核心概念
- Near RealTime(NRT): 近实时;两个意思。第一:从写入数据到es到数据可以被搜索中间有一个小延迟,大致1秒。第二,基于es进行搜索或数据分析的时间级别大 致在秒级别;
- Cluster : 集群 ,包含多个es节点,每一个简单属于那个集群是通过配置的,集群名称默认是 elasticsearch ,对于中小型的企业,完全只部署一个es节点就可以,很正常的事情。
- Node: 节点 ,集群中的