ElasticSearch 索引分片
在 es 的概念中,最重要的一个概念便是索引。索引是真实数据的载体,对索引的管理如果不慎重,则会带来很多的性能问题。
用过es的小伙伴都应该了解,我们应该在创建索引的时候为索引创建分片数,并且一个索引的分片数一经指定后就不能再修改(相比,副本数可以通过命令随时更改)。
在通常情况下,我们都会通过预判数据量级和 过度分配 这一策略来避免因数据量过大或QPS增长带来的必须需要迁移索引的场景。
关于具体分片和过度分配以及相关分配策略的介绍,请移步 选择恰当的分片数量和分片副本数量 。
自定义分片坐落节点
在我们的生产中,遇到了一个实际问题:在一个集群中,有两个索引比其余索引在数据量和 QPS 上的要求都高很多,这样在很多时候这两个索引会影响其余索引的性能。在阅读了 elasticsearch 的相关文档后,我们可以通过给集群打tag的方式,来将集群划分为几个子域,从而实现对特殊索引进行指定节点存储,使得其不影响其他索引的性能,同时虽然我们将 es 的节点划分为不同子域,但是实际上还是属于同一集群,对外提供服务,该改动对外界无感知,也做到了最小修改的情况下解决问题。
实践过程
调研 es 官方支持
在 elasticsearch 官方文档的 IndexModules -> Index Shard Allocation 节的介绍中,我们可以通过 elasticsearch 原生提供的一些设置来对分片的分配进行 手动干预 。
在 elasticsearch 中,提供了一种叫做 Shard Allocation Filtering 的策略。官方对于该策略的描述翻译过来是&#x