Elasticsearch进阶(一)写入性能基准测试写入性能优化(56小时到5小时),chunk_size探讨

本文介绍了Elasticsearch的写入性能优化过程,包括基准测试、副本数调整、chunk_size探索、刷新间隔设置、JVM参数优化等,最终实现了性能的显著提升。测试环境为macOS,通过调整不同参数,如将副本数设为1、增大bulk提交量、禁用swap等,性能提升了11倍。
摘要由CSDN通过智能技术生成

进入正题之前,解决之前的一个疑问:Elasticsearch集群是否已经正确工作?

截图时,只上传过一次小测试数据(143万条),设置为:

"number_of_shards": 5,
"number_of_replicas": 2

这里写图片描述

  • 从图中可以看出,ip10节点上设置的数据目录:data1和data2目录工作正常,但是数据相同
  • ip12中数据与ip10中数据不同,但是data1与data2数据相同
  • ip13数据与ip12相同
  • ip11既不是master候选者,也不是data节点,验证发现确实无数据

这里写图片描述

这里写图片描述
分配多个分片和副本是分布式搜索功能设计的精髓

测试环境

系统:macOS 10.13.4
处理器:2.3Ghz Inter Core i5
内存:8 GB 2133 MHz LPDDR3
SSDs

注:jamesjxin在博客中说到

确保性能测试持续30分钟以上以确认长时间的性能;短时间的测试可能不会碰到segment合并和GC,无法确认这些因素的影响

因时间有限,我就不那样测了。
PS:但是我的测试集确实太小了些,象征性的思路、过程走一波吧。

优化缘由

近1T(约5亿)数据需上传elasticsearch集群,但是第一次的测序跑了会后,预估大概需要跑56小时
[
单机器上传:
centos 6.9
Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10GHz
48G内存
]

用十万条数据做基准测试

1.索引 diglab_1:

"
  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值