flume写到HDFS处理小文件问题

最新推荐文章于 2023-09-03 17:54:57 发布

chilai4545

最新推荐文章于 2023-09-03 17:54:57 发布

阅读量707

点赞数 1

文章标签：大数据

原文链接：https://my.oschina.net/dreamness/blog/3093956

版权

当使用hdfs sink时有可能会产生严重的小文件问题。
通过配置rollInterval, rollSize, rollCount三个参数来缓解小文件问题。

a1.sinks.hdfssink.type                   = hdfs
a1.sinks.hdfssink.hdfs.path              = hdfs://c1:8020/flume/alertlog/%y%m%d%H%M/origin
a1.sinks.hdfssink.filePrefix             = alert-
a1.sinks.hdfssink.hdfs.useLocalTimeStamp = true
a1.sinks.hdfssink.hdfs.rollInterval      = 60
a1.sinks.hdfssink.hdfs.rollSize          = 10485760
a1.sinks.hdfssink.hdfs.rollCount         = 0
a1.sinks.hdfssink.hdfs.codeC             = snappy
a1.sinks.hdfssink.hdfs.fileType          = CompressedStream
a1.sinks.hdfssink.hdfs.writeFormat       = Text

转载于:https://my.oschina.net/dreamness/blog/3093956

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chilai4545

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
flume写到HDFS处理小文件问题

当使用hdfs sink时有可能会产生严重的小文件问题。通过配置rollInterval, rollSize, rollCount三个参数来缓解小文件问题。 a1.sinks.hdfssink.type = hdfsa1.sinks.hdfssin...
复制链接

扫一扫