flume 如何连接hdfs

本文档介绍了如何配置Flume以连接到HDFS。首先,需要启动DFS并关闭防火墙,然后在HDFS主目录下创建待监控的文件夹。接着,在Flume的conf目录下创建a4.conf配置文件,详细配置Flume连接HDFS的相关参数。启动Flume agent后,通过检查flumedir文件夹确认数据已成功传输。当在监控的a1_test文件夹中添加文件时,Flume能实时捕获并读取这些文件。
摘要由CSDN通过智能技术生成

准备

1    启动dfs

2    关闭防火墙

3    主目录下创建需要监控的文件夹 


连接hdfs

在flume下的conf下创建a4.conf

vi conf/a4.test
#注意,此命令在flume文件夹下

编辑a4.conf

#设置agent的source,sink,channel
a4.channels = c1
a4.sinks = k1
a4.sources =s1
#设置source
a4.sources.s1.type = spooldir                      
a4.sources.s1.spoolDir =/home/hadoop/a1_test     #a1_test是之前新建的文件夹名
#设置channel的参数  
a4.channels.c1.type = memory 
#设置sink
a4.sinks.k1.type = hdfs
a4.sinks.k1.hdfs.path = hdfs://python:9000/user/hadoop/flumedir/%y-%m-%d/%H%M/      
a4.sinks.k1.hdfs.filePrefix = Data
a4.sinks.k1.hdfs.round = true
a4.sinks.k1.hdfs.roundValue = 10
a4.sinks.k1.hdfs.roundUnit = minute
a4.sinks.k1.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值