ElasticSearch 基本概念
ElasticSearch 亦可简称为 es ,是对 Lucene 的进一步封装,实现了开箱即用的效果。
一:特点
ElasticSearch 是一个分布式的搜索引擎和数据分析引擎;可实现全文检索,结构化检索,数据分析;可对大量数据进行近实时的处理(秒级别的处理)
二:核心知识
1、NRT --(Near Realtime) 近实时 秒级别处理
2、Cluster -- 集群,包含多个节点
3、Node -- 节点,集群中的一个节点
4、Index -- 索引 相似的结构数据
5、Type -- 类型 Index 包含 type,Index 里面可又多个 type
6、Document -- 文档 中的数据集合
7、Field -- es 中最小的数据单元,就是一条数据
8、Shard -- Index 会被分为多个 shard ,shard 又分为 primary Shard (简称为 Shard)和 replica Shard(简称为 replica)
ES 规定 在一台服务器上 primary Shard 和 replica Shard 不能同时存在,这样保证不了高可用,即一个 primary Shard 宕机后,数据丢失,如果是分布在不同的服务器上,即使 primary Shard 宕机还有 replica Shard 提供服务,而在 ES 中 replica Shard 还有一个作用就是提供 查询的功能,可以提升搜索的速度,和吞吐量。
Field < Document < Type < Index
其实 ElasticSearch 就是相当于数据库,Index 相当于数据库,Type 相当于表,Document 相当于行,Field 相当于行中的一个数据