前面已经给大家讲过flume和Kafka的简介以及安装,今天就给大家讲讲二者如何关联使用。
本文主要就是讲解如何使用flume采集日志信息后把数据写入kafka中,由于时间关系,这里就暂时用伪数据,把存放伪数据的文件放到专门用于flume监听文件的目录中就是前面提到过的/opt/soft/datas下。
1.配置flume
先新建配置文件用于关联kafka
还是在/opt/flumeconf下创建properties文件,并添加以下配置
cd /opt/flumeconf
vi conf_0812_kafka.properties
a5.channels=c5
a5.sources=s5
a5.sinks=k5
a5.sources.s5.type=spooldir
a5.sources.s5.spoolDir=/opt/soft/datas
a5.sources.s5.interceptors=head_filter
#正则拦截器
a5.sources.s5.interceptors.head_filter.type