Es性能优化

 

 

1. Es中10亿级别的数据量,如何提高查询效率

(1) 性能优化关键:file system cache

a. 不要期待随手调一个参数,就可以万能的应对所有性能慢的场景

b. es依赖于底层的file system cache,如果给file system cache更多的内存,尽量让内存容纳所有的idx segment file索引数据文件,则搜索时均走内存,性能很高。如果内存较少,其他索引将存入磁盘,从磁盘搜索的性能可能是数秒。

c. 生产环境的最佳情况,是仅仅在es中存少量属性字段,即需要用于搜索的那些索引,额外的属性存入其他数据库中,如mysql/mongo/hbae。

d. 如果内存确实是瓶颈,可以采用数据预热,即单独做一个专门的缓存预热子系统,存储比较热门的数据到file system cache。

e. 也可以采用冷热分离,i将冷数据写入一个索引,热数据写入另一个索引,确保热数据在被预热之后,尽量留在file system cache中,别让冷数据给冲刷掉。

f. 不要让es做数据关联查询等数据,在document模型设计时考虑,将关联后的数据存入es中

g. 分页查询性能较差,因此不允许深度分页,可以用scroll api不断下拉一页一页展示, scroll一次性生成所有数据的一个快照,缺点是不适于随意跳到任何一页的情景

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch 是一个高性能的分布式搜索引擎,但是在处理大量数据时,可能会出现性能瓶颈。以下是一些 Elasticsearch 性能优化的建议: 1. 确保 Elasticsearch 集群的硬件资源充足。例如,CPU、内存、磁盘空间等。可以使用 Elasticsearch 的监控工具来监测集群资源的使用情况,以便及时进行扩容。 2. 对于大型数据集,使用分片可以提高 Elasticsearch 的性能。可以考虑增加分片数量,以提高搜索和写入的速度。 3. 使用合适的索引设置,例如合理的分词器和分析器,可以提高搜索效率。 4. 避免使用过多的查询,因为每个查询都会占用系统资源。可以使用缓存技术来优化查询性能。 5. 合理设置 Elasticsearch 的 JVM 堆内存大小,以确保 Elasticsearch 有足够的内存来处理数据。 6. 使用 Elasticsearch 的缓存机制,例如字段数据缓存、过滤器缓存等,可以显著提高搜索性能。 7. 对于写入频繁的场景,可以考虑使用异步写入方式,避免写入操作对搜索性能产生影响。 8. 对于长时间运行的查询,可以考虑使用 Elasticsearch 的 scroll API,以避免在内存中保留大量数据。 9. 定期清理 Elasticsearch 中的过期数据,以减少硬盘空间占用和搜索性能受到的影响。 10. 使用 Elasticsearch 的监控工具来监控集群性能,并及时处理异常情况,以保证 Elasticsearch 的高可用性和高性能
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值