用flume提交文件到hdfs系统，并保持原来的文件名信息【转】

最新推荐文章于 2023-09-21 17:42:53 发布

盏茶暖阳

最新推荐文章于 2023-09-21 17:42:53 发布

阅读量2.2k

点赞数

用flume提交文件到hdfs系统，并保持原来的文件名信息的配置方式：

配置files_source

spooling

agent1.sources.files_source.type = spooldir
agent1.sources.files_source.spoolDir = /tmp/flumetest/
agent1.sources.files_source.fileHeader = true
agent1.sources.files_source.fileHeaderKey = fileName

配置hdfs_sink

agent1.sinks.hdfs_sink.type = hdfs
agent1.sinks.hdfs_sink.hdfs.path = hdfs://localhost:9000/myflumetestcluster/flume
agent1.sinks.hdfs_sink.fileType = SequenceFile

agent1.sinks.hdfs_sink.fileType = DataStream #值DataStream表示文件类型，不会被压缩

agent1.sinks.hdfs_sink.writeFormat = Text #针对DataStream，使用Text输出格式

agent1.sinks.hdfs_sink.hdfs.filePrefix = %{fileName} #把原来的文件名作为前缀

查看文件的Hadoop命令
ls

使用方法：hadoop fs -ls

如果是文件，则按照如下格式返回文件信息：
文件名 <副本数> 文件大小修改日期修改时间权限用户ID 组ID
如果是目录，则返回它直接子文件的一个列表，就像在Unix中一样。目录返回列表的信息如下：
目录名

修改日期修改时间权限用户ID 组ID
示例：
hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 hdfs://host:port/user/hadoop/dir1 /nonexistentfile
返回值：
成功返回0，失败返回-1。
lsr

使用方法：hadoop fs -lsr
ls命令的递归版本。类似于Unix中的ls -R。

作者：lingzhiwangcn
来源：CSDN
原文：https://blog.csdn.net/lingzhiwangcn/article/details/50460121
版权声明：本文为博主原创文章，转载请附上博文链接！

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。