注: 部分概念介绍来源于网络
文档数量是一样的,但是数据大小不一定一样,产生这种现象的原因在于,主分片和副本分片的segment数量可能不一样。
使用cat/shards命令看下索引的分片信息,
GET _cat/shards/my_index?v
主分片和副本分片虽然文档数量都是一样,但是大小不一样。
使用cat/segment命令来查看分片的segment信息,
GET _cat/segments/my_index?v
从结果中可以看出副本分片上的segment数量比主分片少了一个。这就是造成数据大小不一样的“真凶”。
通常情况下,这种不一致并没有什么影响。ES会帮我们自动处理好分片上segment的数量。当然我们也可以通过ES的force merge命令,强制把分片上的segment合并成指定的数量。
POST my_index/_forcemerge?max_num_segments=1
max_num_segments 参数用来指定最终要合到的segment数量。
通过上面这个命令,我们强制索引合并segment到一个。然后再次用cat/segment看下分片信息,这样我们的主副分片都只有一个segment了。大小自然是一样的。