Flume调优机制
调节Flume的配置参数
1.Source
(1)增加source组件的数量,可以增大source读取数据的能力
(2)batchSize参数决定Source一次批量传输到Channel的event数量;将参数batchSize的值调大,可以调高Source搬运event的能力。
2.Channel
(1)type选择memory时Channel性能最好,但是容错不行,一旦Flume进程意外挂掉可能会导致数据丢失。type选择file时Channel的容错性能好,但是效率不高。使用file时dataDirs配置多个不同的盘下的目录可能会提高效率。
3.Sink
(1)增加Sink的个数可以增加sink消费event的能力。当然Sink也不是越多越好,够用就行,过多会占用系统资源 。
(2)batchSize参数决定一次从Cannel中读取出event的数量,调大batchSize的参数也可以提高效率。