Flume 监控目录文件 spooldir

Flume 监控目录文件 spooldir

Flume应用场景中监控某个目录下的文件进行读取使用的很多,Flume通过source类型为spooldir来进行监控目录下文件,当新增文件时,Flume可将文件进行读取,开发者只需要编写对应的文件序列化器即可将读取的文件转存至HBase、HDFS、或者其他希望的数据格式。
  • 配置实例
test_agent.sources  = test_source
test_agent.channels = test_channel
test_agent.sinks = test_sink

#设置source类型为监控目录类型
test_agent.sources.test_source.type = spooldir
#对应的channel名称
test_agent.sources.test_source.channels = test_channel
#要监控的目录
test_agent.sources.test_source.spoolDir = /data/kafka_test_data/ad/flume_test_channel
test_agent.sources.test_source.deserializer.maxLineLength = 10000

#设置channel类型为内存
test_agent.channels.test_channel.type = memory
test_agent.channels.test_channel.capacity = 100000
test_agent.channels.test_channel.transactionCapacity = 100000

#自定义的Flume sink
test_agent.sinks.test_sink.type = com.test.cdh.flume.sink.hbase.TestHbaseSink
#最终保存的数据格式为HBase
test_agent.sinks.test_sink.znodeParent = /hbase
#HBase所需要的Zookeeper地址列表
test_agent.sinks.test_sink.zookeeperQuorum = mimo42:2181,mimo43:2181,mimo44:2181
#自定义序列化器
test_agent.sinks.test_sink.serializer =  com.test.cdh.flume.sink.hbase.serializer.TestHbaseEventSerializer
#对应的channel名称
test_agent.sinks.test_sink.channel = test_channel
test_agent.sinks.test_sink.batchSize = 1000
#用来表明是否为安全模式
test_agent.sinks.test_sink.safeMode=true
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值