**
ES的查询排序问题
**
一.如果是filter查询(未指定排序条件)
1.从每个shard里查询指定条件的记录(score都默认为0,然后按照doc_id递增)
2.汇总每个shard返回的记录,合并排序
首先比较每个shard的第一条记录的score(高者优先),如果score相同则比较shard_id(低者优先),shard_id相同则比较shard里的hit_index(低者优先),递归
二.如果是普通score查询(未指定排序条件)
1.从每个shard里查询指定条件的记录(score从高到低,相同score按照doc_id递增)
2.首先比较每个shard的第一条记录的score(高者优先),如果score相同则比较shard_id(低者优先),shard_id相同则比较shard里的hit_index(低者优先),递归
三.如果是普通查询(指定排序条件)
1.从每个shard里查询指定条件的记录(按指定sort field排序,相同filed值按照doc_id递增)
2.首先比较每个shard的第一条记录的sort field(高者优先),如果filed值相同则比较shard_id(低者优先),shard_id相同则比较shard里的hit_index(低者优先),递归
相同查询条件有时返回结果不一样的原因:
1.shard的主和副本里面doc_id会不一样(shard独立),查询有时查副本有时查主shard
2.shard里面定期segment会合并(特别是有实时数据入库时),导致里面的doc_id会重新赋值,所以即使都查询主shard,结果顺序也可能不一样