闲话ElasticSearch（二）如何提高查询效率

加班狗的微博

于 2020-04-26 21:50:56 发布

阅读量183

点赞数

文章标签： java elasticsearch 大数据程序人生经验分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangdx001/article/details/105777669

版权

filesystem cache

es 查询的时候，操作系统会将磁盘文件里的数据自动缓存到 filesystem cache 里面去。如果给 filesystem cache 更多的内存，尽量让内存可以容纳所有的 idx segment file 索引数据文件，那么你搜索的时候就基本都是走内存的，性能会非常高。（读磁盘是秒级，读内存是毫秒级）

数据预热

可以开发一个预热的模块，对热数据每隔一段时间，就提前访问一下，让数据进入 filesystem cache 里面去。

冷热分离

将大量的访问很少、频率很低的数据，单独写一个索引，然后将访问很频繁的热数据单独写另一个一个索引。确保热数据在被预热之后，尽量都让他们留在 filesystem os cache 里，避免被冷数据给冲刷掉。

document优化

避免复杂的关联查询尽量别用，可以将关联方在写入之前，将关联后的数据写入到es。尽量避免 join/nested/parent-child等操作。

分页优化

es 的分页性能较低，数据分布在不同shard中，想要分页需要查询每个shard。假如你每页是 10 条数据，你现在要查询第 100 页，实际上是会把每个 shard 上存储的前 1000 条数据都查到一个协调节点上。

限制查询总数

翻页越深，性能就越差。限定翻页数。

固定每页数量

用scroll api来代替from+size，和在传统数据库中使用游标的方式非常相似。

scroll 会一次性给你生成所有数据的一个快照，然后每次滑动向后翻页就是通过游标 scroll_id 移动，性能会提升很多。（毫秒级）

但是使用scroll不能指定跳转页数，只能一页页的翻。

需要制定es 要保存此次搜索的上下文多长时间，要确保翻页有效时间。

加班狗的微博

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
闲话ElasticSearch（二）如何提高查询效率

filesystem cachees 查询的时候，操作系统会将磁盘文件里的数据自动缓存到filesystem cache里面去。如果给filesystem cache更多的内存，尽量让内存可以容纳所有的idx segment file索引数据文件，那么你搜索的时候就基本都是走内存的，性能会非常高。（读磁盘是秒级，读内存是毫秒级）数据预热可以开发一个预热的模块，对热数据每隔...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。