1和2,适合的是,你的es java client程序,可以采取批量写的场景
3,比较通用的,比较合适的是,你对于写入数据到可以读到能够接受比较大的延迟
4,一次性批量导入数据的场景
5/6/7/8/9,通用型,尽量都去做到
1/2/3/4,都是有各自适用的场景,如果场景合适,就尽量用,因为对性能的提升都是很明显的
5/6/7/8/9,其中通用,尽量去优化你的集群,但是其中最重要的,就是3块,filesystem cache更大的内存,给index buffer最充足的内存,一个是用SSD固态硬盘
1、用bulk批量写入
你如果要往es里面灌入数据的话,那么根据你的业务场景来,如果你的业务场景可以支持,可以做到,让你将一批数据聚合起来,一次性写入es,那么就尽量采用bulk的方式,每次批量写个几百条这样子。
bulk批量写入的性能比你一条一条写入大量的document的性能要好很多。但是如果要知道一个bulk请求最佳的大小,需要对单个es node的单个shard做压测。先bulk写入100个document,然后200个,400个,以此类推,每次都将bulk size加倍一次。如果bulk写入性能开始变平缓的时候,那么这个就是最佳的bulk大小。并不是bulk size越大越好,而是根据你的集群等环境具体要测试出来的,因为越大的bulk size会导致内存压力过大,因此最好一个请求不要发送超过10mb的数据量。
2、使用多线程将数据写入es
单线程发送bulk请求是无法最大化es集群写入的吞吐量的。如果要利用集群的所有