es和lucene 封装
- 分布式的文档存储引擎
- 分布式的搜索引擎和分析引擎
- 分布式,支持PB级数据
es 核心概念
- NRT: 写入数据到可以被所搜到有一个小延迟(大概1秒)
- 集群:Cluster,集群包含多个节点,每个节点也有一个名称(默认是elasticsearch)
- Node:节点
- Document:最小的数据单元,可以是一条商品数据,一条分类数据
- Index:索引,包含一堆相似结构的文档数据,比如一个客户索引,商品索引,订单索引,索引有一个名称
- Type:类型,每个索引里面可以有一个或者多个type,type 是index中的数据逻辑分类,商品中的,日化商品type,电器商品type
- shard: 单台服务器无法存储大量数据,es可以将一个索引切分为多个shard,分布在多台服务器上存储。有了sharp就可以横向扩展,存储更多的数据,让存储分析到多台服务器上区执行,提高吞吐量和性能。每个shard都是一个lucene index
- replica:副本防止丢失
shard 叫做primary shard 一般简称为shard
replica 叫做replica shard 一般简称为replica
和传统数据库的比较
es | 数据库 |
index | 库 |
Type | 表 |
Document | 一条记录 |