Flume HDFS Sink配置详解

NameDefaultDescription
channel
 
type组件的名称,必须为:HDFS
hdfs.pathHDFS目录路径,例如:hdfs://namenode/flume/webdata/
hdfs.filePrefixFlumeDataHDFS目录中,由Flume创建的文件前缀。
hdfs.fileSuffix追加到文件的后缀,例如:.txt
hdfs.inUsePrefix文件正在写入时的前缀。
hdfs.inUseSuffix.tmp文件正在写入时的后缀。
hdfs.rollInterval30当前写入的文件滚动间隔,默认30秒生成一个新的文件 (0 = 不滚动)
hdfs.rollSize1024以文件大小触发文件滚动,单位字节(0 = 不滚动)
hdfs.rollCount10
 
 
 
 
 
 
 
以写入的事件数触发文件滚动。(0 = 不滚动)
hdfs.idleTimeout0超时多久以后关闭无效的文件。(0 = 禁用自动关闭的空闲文件)但是还是可能因为网络等多种原因导致,正在写的文件始终没有关闭,从而产生tmp文件
hdfs.batchSize100有多少Event后,写到文件才刷新到HDFS。
hdfs.codeC压缩编解码器,可以使用:gzip, bzip2, lzo, lzop, snappy
hdfs.fileTypeSequenceFile文件格式:通常使用SequenceFile(默认)DataStream 或者 CompressedStream
(1)DataStream不能压缩输出文件,请不用设置hdfs.codeC编码解码器。
(2)CompressedStream要求设置hdfs.codeC来制定一个有效的编码解码器。
hdfs.maxOpenFiles5000HDFS中允许打开文件的数据,如果数量超过了,最老的文件将被关闭。
hdfs.callTimeout10000允许HDFS操作的毫秒数,例如:open,write, flush, close。如果很多HFDS操作超时,这个配置应该增大。
hdfs.threadsPoolSize10

每个HDFS sink的HDFS的IO操作线程数(例如:open,write)

hdfs.rollTimerPoolSize1每个HDFS sink调度定时文件滚动的线程数。
hdfs.kerberosPrincipal安全访问HDFS Kerberos的主用户。
hdfs.kerberosKeytab安全访问HDFS Kerberos keytab
hdfs.proxyUser
 
 
hdfs.roundfalse时间戳应该被四舍五入。(如果为true,会影响所有的时间,除了t%)
hdfs.roundValue1四舍五入的最高倍数(单位配置在hdfs.roundUnit),但是要小于当前时间。
hdfs.roundUnitsecond四舍五入的单位,包含:secondminute or hour.
hdfs.timeZoneLocal Time时区的名称,主要用来解决目录路径。例如:America/Los_Angeles
hdfs.useLocalTimeStampfalse使用本地时间替换转义字符。 (而不是event header的时间戳)
hdfs.closeTries0在发起一个关闭命令后,HDFS sink必须尝试重命名文件的次数。如果设置为1,重命名失败后,HDFS sink不会再次尝试重命名该文件,这个文件处于打开状态,并且用.tmp作为扩展名。如果为0,Sink会一直尝试重命名,直至重命名成功。如果文件 失败,这个文件可能一直保持打开状态,但是这种情况下数据是完整的。文件将会在Flume下次重启时被关闭。
hdfs.retryInterval180在几秒钟之间连续尝试关闭文件。每个关闭请求都会有多个RPC往返Namenode,因此设置的太低可能导致Namenode超负荷,如果设置0或者更小,如果第一次尝试失败的话,该Sink将不会尝试关闭文件。并且把文件打开,或者用“.tmp”作为扩展名。
serializerTEXT可能的选项包括avro_event或继承了EventSerializer.Builder接口的类名。
serializer.*
 
 

转载于:https://www.cnblogs.com/cctvyuzhou/p/9116534.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值