flume日志写入到hdfs按时间分割

程研板

于 2021-02-08 14:49:43 发布

阅读量406

点赞数 1

分类专栏： # Flume 文章标签： flume hadoop hdfs 大数据

本文链接：https://blog.csdn.net/qq_38258720/article/details/113756676

版权

Flume 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

exec-hdfs-agent.conf:

exec-hdfs-agent.sources = exec-source
exec-hdfs-agent.sinks = hdfs-sink
exec-hdfs-agent.channels = memory-channel

# Describe/configure the source
exec-hdfs-agent.sources.exec-source.type = exec
exec-hdfs-agent.sources.exec-source.command = tail -F ~/logs/access.log
exec-hdfs-agent.sources.exec-source.shell = /bin/bash -c

# Describe the sink
exec-hdfs-agent.sinks.hdfs-sink.type = hdfs
exec-hdfs-agent.sinks.hdfs-sink.hdfs.path = hdfs://hadoop000:8020/data/flume/events/%y-%m-%d/%H%M/%S
exec-hdfs-agent.sinks.hdfs-sink.hdfs.fileType=DataStream
exec-hdfs-agent.sinks.hdfs-sink.hdfs.writeFormat=Text
exec-hdfs-agent.sinks.hdfs-sink.hdfs.batchSize=100
exec-hdfs-agent.sinks.hdfs-sink.hdfs.filePrefix = events-
exec-hdfs-agent.sinks.hdfs-sink.hdfs.round = true
exec-hdfs-agent.sinks.hdfs-sink.hdfs.roundValue = 1
exec-hdfs-agent.sinks.hdfs-sink.hdfs.roundUnit = minute
exec-hdfs-agent.sinks.hdfs-sink.hdfs.useLocalTimeStamp = true

# Use a channel which buffers events in memory
exec-hdfs-agent.channels.memory-channel.type = memory

# Bind the source and sink to the channel
exec-hdfs-agent.sources.exec-source.channels = memory-channel
exec-hdfs-agent.sinks.hdfs-sink.channel = memory-channel

命令解释：
文件夹按/%y-%m-%d/%H%M/%S进行分割。
按一分钟进行四舍五入。

运行结果：

[hadoop@hadoop000 logs]$ hadoop fs -ls /data/flume/events/21-02-08
Found 4 items
drwxr-xr-x   - hadoop supergroup          0 2021-02-08 14:22 /data/flume/events/21-02-08/1422
drwxr-xr-x   - hadoop supergroup          0 2021-02-08 14:23 /data/flume/events/21-02-08/1423
drwxr-xr-x   - hadoop supergroup          0 2021-02-08 14:24 /data/flume/events/21-02-08/1424
drwxr-xr-x   - hadoop supergroup          0 2021-02-08 14:25 /data/flume/events/21-02-08/1425

[hadoop@hadoop000 logs]$ hadoop fs -ls /data/flume/events/21-02-08/1425/00
Found 7 items
-rw-r--r--   1 hadoop supergroup        300 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500050
-rw-r--r--   1 hadoop supergroup        300 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500051
-rw-r--r--   1 hadoop supergroup        300 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500052
-rw-r--r--   1 hadoop supergroup        300 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500053
-rw-r--r--   1 hadoop supergroup        300 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500054
-rw-r--r--   1 hadoop supergroup        300 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500055
-rw-r--r--   1 hadoop supergroup        270 2021-02-08 14:25 /data/flume/events/21-02-08/1425/00/events-.1612765500056

程研板

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
flume日志写入到hdfs按时间分割

exec-hdfs-agent.conf:exec-hdfs-agent.sources = exec-sourceexec-hdfs-agent.sinks = hdfs-sinkexec-hdfs-agent.channels = memory-channel# Describe/configure the sourceexec-hdfs-agent.sources.exec-source.type = execexec-hdfs-agent.sources.exec-source.com
复制链接

扫一扫