问题现象
在Elasticsearch中,当遇到查询特定日期后的数据时无法返回结果或统计值的问题,这通常是因为Elasticsearch的生命周期管理功能导致的。当索引达到一定的时间阈值时,Elasticsearch会自动将其分裂为多个冷热索引。新分裂的索引会继承原始索引的默认设置,如index.max_result_window
,这通常是10000。然而,原始索引可能已经被调整以允许更大的结果窗口值。
因此,当查询跨越索引分裂日期时,查询可能会因为窗口值过大而无法正确执行。在Java代码中,可能使用了SearchRequest对象,并将size参数设置为Integer.MAX_VALUE
,即2147483647。这个值超出了Elasticsearch默认允许的窗口范围,导致查询失败,而没有抛出任何错误。
为了解决这个问题,需要在每个索引分裂后手动调整新索引的最大结果窗口值。这可以通过发送一个PUT请求到_all/_settings端点来实现,设置index.max_result_window
为2147483647。
请注意,这个问题不会影响Elasticsearch的拉取接口(pull interface),这意味着从Elasticsearch拉取数据的操作不会受到影响。
解决方案
每次分裂完索引后重新发送该请求
[PUT] _all/_settings
{
"index.max_result_window": 2147483647
}