今天来刚学完Flume,来做一个简单的入门案例:使用Flume实时读取本地目录的文件到HDFS。即本地的目录有增加时就会把文件上传到HDFS。
使用Flume采集数据的步骤就是创建配置文件,然后启动监控就可以监听了。
创建配置文件
这个配置文件是要自己创建的,后缀为.conf。名字可以自己取,但是也要本着见名知意的原则。所以我命名为flume-dir-hdfs.conf。这个文件一般放在flume的job目录下。flume的每一个任务就要创建一个配置文件。
创建配置文件:
vim flume-dir-hdfs.conf
添加如下内容:
a3.sources = r3
a3.sinks = k3
a3.channels = c3
# Describe/configure the source
a3.sources.r3.type