ElasticSearch：修改各节点的分片上限

最新推荐文章于 2025-03-25 20:19:32 发布

Oxye

最新推荐文章于 2025-03-25 20:19:32 发布

阅读量2.3k

点赞数

分类专栏： ElasticSearch 分布式文章标签： elasticsearch 分布式

本文链接：https://blog.csdn.net/weixin_43859729/article/details/118229457

版权

ElasticSearch 同时被 2 个专栏收录

9 篇文章

订阅专栏

分布式

7 篇文章

订阅专栏

es节点分片达到上限

es在使用一段时间后会发生新建索引失败的错误
这时候查看分片上限

GET _cluster/health

会展示集群状态，包括节点总数，如果分片超了，集群状态可能变成yellow

Elasticsearch 默认的分片上限1000

修改分片上限

DSL输入

在elasticsearch-head或kibana输入

PUT _cluster/settings
{
    "persistent": {
        "cluster": {
            "max_shards_per_node":10000
        }
    }
}

命令行输入

curl -X PUT localhost:9200/_cluster/settings -H "Content-Type: application/json" -d '{ "persistent": { "cluster.max_shards_per_node": "10000" } }'

修改后确认

再查看集群现有配置

GET /_cluster/settings?pretty

可以看到persistent 持久化的配置配上了

{
  "persistent" : {
    "cluster" : {
      "max_shards_per_node" : "10000"
    },
    "xpack" : {
      "monitoring" : {
        "collection" : {
          "enabled" : "true"
        }
      }
    }
  },
  "transient" : {}
}

注意

开发、测试环境这么玩可以，生产环境要考虑资源配比，盲目调大参数不可取

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Oxye

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

ES系列：节点默认限制分片数

NIO4444

08-27

1953

Elasticsearch v7.0.0 开始，集群中的每个节点默认限制 1000 个shard

elasticsearch 分片和副本

weixin_43394129的博客

12-26

1279

一.分片　　分片包括主分片和副本分片，主分片的数量在创建索引时就固定下来了，无法更改主分片数量。 1.es的分片是使用在索引上，数据量少的建议使用1个分片，每个分片最好不超过30GB。你认为你的数据能达到200GB, 我们推荐你最多分配7到8个分片。 2.过多的分片也需要额外的成本：　　1)每个分片本质上就是一个Lucene索引, 因此会消耗相应的文件句柄, 内存和CPU资源。　　2)每个...

1 条评论您还未登录，请先登录后发表或查看评论

elasticsearch 查询超10000的解决方案

苍煜

07-12

7790

scroll查询的相应数据是非实时的，如果遍历过程中插入新的数据，是查询不到的。并且保留上下文需要足够的堆内存空间。相比于 from/size 和 search_after 返回一页数据，Scroll API 可用于从单个搜索请求中检索大量结果。但是 scroll 滚动遍历查询是非实时的，数据量大的时候，响应时间可能会比较长适用场景全量或数据量很大时遍历结果数据，而非分页查询。scroll方案基于快照，不能用在高实时性的场景下，建议用在类似数据导出场景下使用。

ElasticSearch修改默认分片数量

kubernetes中文社区

08-11

5107

PUT /_cluster/settings { "persistent": { "cluster": { "max_shards_per_node":10000 } } } es 默认分片数量是100 使用此方法修改成10000 Elasticsearch基于JAVA开发而来，Elasticsearch能够从传统的解决方案中脱颖而出，自然尤其深邃之处。本次的课程我们将不再满足于Elasticsearch的基础技术，而是全面且深入的进行探究。从Elasticsea..

如何合理设置Elasticsearch集群分片数和节点数

饽饽的博客

03-25

420

合理设置 ES 集群的分片数和节点数需综合考量硬件资源、查询模式和数据增长等多方面因素，在性能、成本和可扩展性之间找到平衡。实际应用中，可能还需要通过测试和监控不断优化配置。

修改默认ElasticSearch集群的分片数限制

叱咤少帅的博客

04-23

2万+

背景收到一个学员的问题，在创建索引的时候，提示如下报错：原因分析: 如果不去更改es的默认配置，es集群的默认分片数是1000，所以你需要调大ElasticSearch的默认分片数。解决：使用Head插件或者Kiabana的Dev Tools 执行如下命令： PUT /_cluster/settings { "transient": { "cluster": ...

ES修改集群最大分片数量max_shards_per_node

杂货铺子

05-20

1万+

今天在查看 skywalking-oap 服务时，发现日志中出现了大量的报错信息，内容如下： [967]: index [skywalking-test_segment-20210520], type [_doc], id [2bac9570f91e4c468c76f853c8c3adc6.142.16214811300613334], message [ElasticsearchException[Elasticsearch exception [type=illegal_argument_excepti

【大数据】elasticsearch分片数量超出限制

weixin_43833235的博客

08-27

1850

生产环境中排查elasticsearch中的问题和排查问题思路，希望帮到更多有需要的同行者

ES设置最大查询条数限制，打破限制，聚合分组数量限制打破

桂秋拾貳

11-09

5198

今天在做进行查询的时候发现，在进行分页的时候，数据超出10000以后得页数，查询的时候会报错。后查询了es官方文档发现，查询数量的默认值是10000；官网链接：https://www.elastic.co/guide/en/elasticsearch/reference/7.8/index-modules.html#dynamic-index-settings。

es动态分配分片_ES最佳实践之分片使用优化

weixin_30701661的博客

12-30

931

Elasticsearch最佳实践之分片使用优化作者：老生姜一、遇到的问题与大多数分布式系统一样，Elasticsearch按照一定的Hash规则把用户数据切分成多个分片，然后打散到不同机器进行存储，从而实现大规模数据的分布式存储。cluster.png然而在一些复杂的应用场景中使用Elasticsearch，经常会遇到分片过多引发的一系列问题。起初我们在支撑内部某业务时，单集群内有约1000个子...

【Elasticsearch】搜索时分片路由

risc123456的博客

02-19

465

Elasticsearch 的Search Shard Routing（搜索分片路由）是一个核心机制，用于在分布式环境中高效地分发和执行搜索请求，确保查询能够快速、准确地返回结果，同时充分利用集群资源并保持系统的高可用性。将搜索请求限制在本地节点的分片上。• 分片重新分配：在集群状态发生变化时（例如节点故障或分片迁移），Elasticsearch 会动态调整分片路由，确保搜索请求始终能够找到目标分片。• 副本分片的冗余：副本分片的存在确保了即使某个节点或分片不可用，搜索请求仍然可以通过其他副本分片完成。

Elasticsearch常用语句

高云平的博客

03-19

493

1、查看整个集群的状态, 其中segments.count 为段总数。2、修改节点最大分片数：将索引每个节点的最大分片数增加至6个。3、修改所有副本数：将索引副本数增加至1。其中sm 即为segment memory。2、查看每个段，计算行数，统计总个数。3、查看具体某个索引段个数。

Elasticsearch权威指南-学习笔记

最新发布

03-29

<think>嗯，用户之前问过关于Elasticsearch分布式架构如何处理节点故障的问题，现在又接着问分片和副本。看来他们可能是在学习ES的分布式机制，或者是正在搭建集群需要了解这些概念。首先，用户之前的问题是关于节点故障的自动处理，所以现在问分片和副本应该是想深入理解数据存储和冗余的机制。分片和副本是ES实现高可用和扩展性的核心，需要详细解释两者的区别和联系。用户可能不太清楚分片和副本的作用，或者混淆了它们的概念。需要明确分片是数据分割的单位，而副本是分片的复制，用于故障恢复和负载均衡。可能还需要举例说明，比如索引如何被分成多个分片，每个分片如何有副本。另外，用户可能关心实际应用中的配置，比如如何设置分片数和副本数，最佳实践是什么。需要提到分片过多或过少的影响，副本数量的调整对集群性能的影响，以及如何根据硬件资源来规划。还要注意用户可能的误区，比如认为增加副本可以无限提高性能，但实际上副本会占用存储和计算资源。需要解释平衡可用性和资源消耗的重要性。用户可能还需要知道分片和副本在故障恢复中的具体作用，比如主分片失效时副本如何提升为主分片，恢复过程中数据如何同步。这部分可以结合之前的节点故障处理机制来回答，形成知识连贯性。最后，可能还需要提到一些常见问题，比如分片无法分配的原因，如何监控分片状态，以及调整分片和副本时的注意事项。这些实际操作的内容对用户来说可能非常实用。</think>### Elasticsearch 分片（Shard）与副本（Replica）详解 --- #### 一、核心概念对比 | 特性 | **分片（Shard）** | **副本（Replica）** | |-------------|--------------------------------------|--------------------------------------| | **本质** | 数据的最小物理存储单元 | 分片的完整拷贝 | | **类型** | 主分片（Primary） / 副本分片（Replica）| 只能是主分片的副本 | | **读写权限** | 主分片可读写，副本分片默认只读 | 仅响应查询请求 | | **创建时机** | 索引创建时固定数量（不可修改） | 可动态调整数量 | | **作用目标** | 解决**数据水平扩展**问题 | 解决**高可用**和**查询负载均衡**问题 | --- #### 二、技术实现细节 ##### 1. **分片工作机制** - **分片公式**： $$ \text{总数据存储量} = \text{主分片数} \times (1 + \text{副本数}) \times \text{单分片数据量} $$ - **路由机制**：文档通过哈希算法分配到指定主分片： $$ \text{shard\_num} = hash(\_routing) \% \text{num\_primary\_shards} $$ - **分片限制**：单个分片建议大小在 `10GB-50GB`（超过 `100GB` 可能影响性能） ##### 2. **副本运作原理** - **实时同步**：主分片通过 `Translog` 保证数据变更顺序，副本采用 `pull` 模式同步数据 - **一致性模型**： - **同步写入**：需多数副本确认（通过 `wait_for_active_shards` 参数控制） - **异步刷新**：默认每秒刷新（`refresh_interval=1s`） --- #### 三、配置与优化策略 ##### 1. **分片数量决策** - **黄金法则**：分片总数 = 节点数 × 单节点承载分片数（建议 `500-1000`/节点）例如：3节点集群，单节点承载上限 800 分片 → 总容量约 `2400` 分片 - **动态调整限制**：主分片数创建后不可变，只能通过 `Reindex API` 重建索引调整 ##### 2. **副本配置技巧** ```json // 创建索引时指定分片配置 PUT /my_index { "settings": { "number_of_shards": 3, // 主分片数 "number_of_replicas": 2 // 每个主分片的副本数 } } // 动态修改副本数（实时生效） PUT /my_index/_settings { "number_of_replicas": 1 } ``` ##### 3. **性能优化要点** - **冷热分离架构**：使用 `ILM（Index Lifecycle Management）` 将旧索引副本数降为 `0` - **写入优化**：临时关闭副本（`index.number_of_replicas=0`）提升批量导入速度 - **查询加速**：增加副本可实现读请求的**多副本负载均衡** --- #### 四、故障场景应对 ##### 1. **分片未分配（UNASSIGNED）** - **常见原因**： - 磁盘空间不足（`85%` 水位线触发只读模式） - 节点属性不匹配分配规则（如 `rack` 标签约束） - **解决方案**： ```bash # 强制分配分片（慎用） POST /_cluster/reroute { "commands": [{ "allocate_stale_primary": { "index": "my_index", "shard": 0, "node": "node-1", "accept_data_loss": true } }] } ``` ##### 2. **副本同步延迟** - **检测方法**： ```bash GET /_cat/shards?v&h=index,shard,prirep,state,docs,store ``` - **处理方案**： - 检查网络带宽（`indices.recovery.max_bytes_per_sec`） - 优化映射字段类型，减少 `_source` 体积 --- #### 五、最佳实践总结 1. **容量规划**： - 预估数据总量 → 确定主分片数 - 根据 SLA 要求 → 确定副本数（生产环境至少 `1` 副本） 2. **硬件匹配原则**： - 单个分片数据量 ≈ 节点内存的 `1/10`（如 `64GB` 内存 → 分片大小 `6-7GB`） - 使用 `SSD` 磁盘降低副本同步延迟 3. **监控关键指标**： - `indices.search.fetch_current`（副本查询负载） - `indices.indexing.index_current`（主分片写入压力） - `thread_pool` 的 `write`/`search` 队列深度 4. **特殊场景处理**： - **时序数据**：使用 `Rollover API` 自动创建新分片 - **全局搜索**：设置 `preference=_primary` 强制主分片查询 --- #### 六、经典误区解析 - **误区1**："增加副本数一定能提升查询性能" ✅ 实际：当查询为 `CPU 密集型` 时，过多副本可能引发线程竞争 - **误区2**："主分片越多越好" ✅ 实际：分片过多会导致 `元数据管理开销` 指数级增长 - **误区3**："副本可以替代备份" ✅ 实际：副本不能防范 `误删除`，仍需 `Snapshot` 实现真正备份 --- 通过合理配置分片与副本，可在**数据可靠性**、**查询性能**、**硬件成本**之间找到最佳平衡点。建议通过 `Elasticsearch Rally` 进行分片方案的基准测试验证。