flume系列之:flume消费数据量较大kafka Topic的source、channel、sink等参数通用设置
- 1、sources.source1.batchSize
- 2、sources.source1.batchDurationMillis
- 3、channels.channel1.capacity
- 4、channels.channel1.transactionCapacity
- 5、sinks.sink1.hdfs.callTimeout
- 6、sinks.sink1.hdfs.maxOpenFiles
- 7、sinks.sink1.hdfs.threadsPoolSize
- 8、sinks.sink1.hdfs.rollTimerPoolSize
- 9、sinks.sink1.hdfs.rollCount
- 10、sinks.sink1.hdfs.rollSize
- 11、sinks.sink1.hdfs.rollInterval
- 12、sinks.sink1.hdfs.idleTimeout
- 13、sinks.sink1.hdfs.batchSize
- 14、source batchSize、channel capacity、channel transactionCapacity、sink batchSize设置关系
- 15、sinks.sink1.hdfs.inUseSuffix
- 16、sinks.sink1.hdfs.filePrefix
- 17、sinks.sink1.hdfs.writeFormat
- 18、sinks.sink1.hdfs.fileType
- 19、sinks.sink1.hdfs.codeC
- 20、sinks.sink1.hdfs.timeZone
- 21、sinks.sink1.hdfs.useLocalTimeStamp
这是一套通用的参数配置,参数设置比较大,主要为了统一flume参数配置,主要是用来消费具有大量数据的kafka topic,也可以用来消费小数据量的kafka topic。
1、sources.source1.batchSize
- sources.source1.batchSize = 7000
- 批处理中写入通道的最大消息数
2、sources.source1.batchDurationMillis
- sources.source1.batchDurationMillis = 5000
- 每次消费topic数据的最大时长,单位:毫秒
3、channels.channel1.capacity
- channels.channel1.capacity = 10000000
- 通道中存储的最大事件数
4、channels.channel1.transactionCapacity
- channels.channel1.tra