1、Elasticsearch对复杂分布式机制的透明影藏特性
Elasticsearch是一套分布式的系统,分布式是为了应对大数据量影藏了复杂的分布式机制。
分片机制(我们可以随随便便就将一些document插入到es集群中去,我们没有care过数据是怎么进行分片的,数据到哪个shard中去)
cluster discovery(集群发现机制,集群status从yellow转green的实现里,直接启动了第二个es进程,那个进程作为一个node自动就发现了集群,并且加入了进去,还接受了部分数据,replica shard)
shard负载均衡(举例,假设现在有3个节点,总共有25个shard要分配到3个节点上去,es会自动进行均匀分配,以保持每个节点的均衡的读写负载请求)
shard副本,请求路由,集群扩容,shard重分配。
2、Elasticsearch支持垂直扩容和水平扩容
垂直扩容:采购更强大的服务器。
水平扩容:采购越来越多的普通服务器,性能比较一般,但是很多普通服务器组织在一起,就能构成强大的计算和存储能力。
扩容对应用程序的透明性。
3、增加或减少节点时的数据rebalance
保持负载均衡
4、master节点
(1)、创建或删除索引
(2)、增加或删除节点
5、节点平等的分布式架构
(1)、节点对等,每个节点都能接收所有的请求。
(2)、自动请求路由
(3)、响应收集
6、shard和replica机制再次梳理
(1)index包含多个shard
(2)每个shard都是一个最小工作单元,承载部分数据,lucene实例,完整的建立索引和处理请求的能力
(3)增减节点时,shard会自动在nodes中负载均衡
(4)primary shard和replica shard,每个document肯定只存在于某一个primary shard以及其对应的replica shard中,不可能存在于多个primary shard
(5)replica shard是primary shard的副本,负责容错,以及承担读请求负载
(6)primary shard的数量在创建索引的时候就固定了,replica shard的数量可以随时修改
(7)primary shard的默认数量是5,replica默认是1,默认有10个shard,5个primary shard,5个replica shard
(8)primary shard不能和自己的replica shard放在同一个节点上(否则节点宕机,primary shard和副本都丢失,起不到容错的作用),但是可以和其他primary shard的replica shard放在同一个节点上
7、创建index是什么样子的
(1)单node环境下,创建一个index,有3个primary shard,3个replica shard
PUT /test_index
{
"settings": {
"number_of_shards": 3,
"number_of_replicas": 1
}
}
(2)、集群status是yellow
(3)、这个时候,只会将3个primary shard分配到仅有的一个node上去,另外3个replica shard是无法分配的。
(4)、集群可以正常工作,但是一旦出现节点宕机,数据全部丢失,而且集群不可用,无法承接任何请求。