[TOC] #控制集群的再平衡 默认情况下,Elasticsearch视图把分片和副本在集群中均衡分布。大多数情况下是好的,但有时候想人为控制此行为。 ##再平衡 再平衡是在集群的不同节点之间移动分片的过程。 ##集群的就绪 索引由分片和副本构成。主分片用于新文档被编入索引以及更新或删除,或者索引发生任何变化时。副本从主分片获取数据。
当主分片都被分配到集群中的节点上,也就达到了黄色状态,集群就已经就绪,可以对外提供服务,此时Elasticsearch会初始化副本。 ##集群再平衡设置 Elasticsearch允许控制再平衡过程,通过设置elasticsearch.yml文件中的几个属性,或使用Elasticsearch REST API。 ###控制再平衡何时开始
cluster.routing.allocation.allow_rebalance
该属性的取值:
always:表名再平衡可以在需要时随时开始
indices_primaries_active:所有主分片都初始化后,再平衡才会开始。
indices_all_active:默认设置,所有分片和副本都初始化后,再平衡才会开始。
###控制同时在节点移动的分片数量
cluster.routing.allocation.cluster_concurrent_rebalance
指定整个集群中同时可以在节点间移动的分片数量。如果集群由很多节点组成,可以提高这个值。默认值2。 ###控制单个节点上同时初始化的分片数量
cluster.routing.allocation.node_concurrent_recoveries
设置Elasticsearch在单个节点上一次可以初始化多少分片。分片还原过程是非常耗I/O的,默认是2. ###控制单个节点上同时初始化的主分片数量
cluster.routing.allocation.node_initial_primaries_recoveries
###控制分配的分片类型
cluster.routing.allocation.enable
控制允许分配哪种类型的分片。取值如下:
all:默认值,所有类型的分片都可以被分配
primaries:只分配主分片,不要分配副本
new_primaries:只分配新创建的主分片
none:完成禁用了分片的分配
###控制单个节点上的并发流数目
indices.recovery.concurrent_streams
允许控制一个节点上一次可以打开多少流,以便从目标分片中恢复一个分片。默认值是3。 #控制分片和副本的分配 ##显式控制分配
指定节点参数 假设希望把更强大的编号为1和2的节点放置在一个叫zone_one的区域,编号3和4的节点资源较少,放在叫zone_two的区域。
配置 在节点1和节点2的elasticsearch.yml配置文件中添加node.zone: zone_one属性。在节点3和节点4的elasticsearch.yml文件中添加类似的node.zone:zone_two。
索引的创建 现在创建shop索引。放在更强的节点:
curl -XPUT 'http://localhost:9200/shop' -d'{ "setting":{ "index":{ "routing.allocation.include.zone":"zone_one" } } }'
意味着希望把shop索引放到node.zone属性等于zone_one的节点。
promotions索引应该放在所有节点,命令如下:
curl -XPOST 'http://localhost:9200/promotions' curl -XPUT 'http://localhost:9200/promotions/_settings' -d'{ "setting":{ "index":{ "routing.allocation.include.zone":"zone_one, zone_two" } } }'
第一个命令创建索引,第二个命令更新index.routing.allocation.include.zone属性的值。
排除节点的分配
节点需求属性 指定分片必须匹配某种规则才能分配到给定节点上。
index.routing.allocation.require
curl -XPOST 'http://localhost:9200/promotions/_settings' -d'{ "index.routing.allocation.require.size":"big_node", "index.routing.allocation.require.zone":"zone_one" }'
Elasticsearch将只会把promotions索引分片分配到node.size属性等于big_node且node.zone属性等于zone_one的节点上。
使用IP地址分配分片 使用IP地址来指定应该包含排除哪些节点用来做分片和副本的分配。
基于磁盘的分片分配 允许基于节点的磁盘使用情况来设置分配规则,因此不会有耗尽磁盘空间或类似的问题。
启动基于磁盘的分片分配:基于磁盘的分片分配默认是禁用的。可以设置cluster.routing.allocation.disk.threshold_enabled属性为true来启用。
配置基于磁盘的分片分配
第二和第三个属性值也可以是一个绝对值。
##集群范围的分配
希望把所有新索引都放置在IP地址为10.1.2.10和10.1.2.11的节点上。
##每个节点上的分片和副本数量 指定单一节点上为单一索引最多可以放置多少分片
curl -XPOST 'localhost:9200/shop/_settings' -d'{ "index.routing.allocation.total_shards_per_node":1 }'
该属性可以放在配置文件中。
##手动移动分片和副本 使用Elasticsearch的_cluste/reroute REST端点。 有以下可用的操作:
把分片从一个节点移动到另一个节点
取消分片的分配
强制分片的分配
###移动分片
move命令允许移动由index属性指定的索引分片和副本。shard属性是要移动的分片的编号。最后,from_node属性指定从哪个节点上移动分片。 ###取消分片分配
上述命令将取消es_node_one节点上shop索引编号为0的分片分配。 ###强制分片的分配 分配一个未分配的分片到指定节点上。
#预热 Elasticsearch允许为类型和索引定义预热查询。 ##定义一个新的预热查询 预热查询和其他查询类似,只是它存储在Elasticsearch一个特殊的名为_warmer的索引中。
把上述查询存储为library索引的预热查询,执行以下命令:
上述命令将注册一个名为tags_warming_query的预热查询。一个索引可以有多个预热查询,但是名字唯一。
添加一个预热查询后,Elasticsearch允许一个新段执行搜索之前,会在那个段上执行定义的预热查询。允许elasticsearch和操作系统缓存数据,以此来加快搜索。
##获取定义的预热查询
##删除一个预热查询
##禁用预热功能
##查询的选择 通常选择执行起来昂贵和需要填充缓存的查询需要预热。如:基于索引中的字段做切面和排序,父子查询,常用的过滤器查询。也可以通过日志查找不尽人意的查询。
注意:过多的预热查询,也会影响Elasticsearch的性能