Flume 部署及相关案例

最新推荐文章于 2022-06-28 20:06:18 发布

晟翊zzZ

最新推荐文章于 2022-06-28 20:06:18 发布

阅读量153

点赞数

分类专栏：安装大数据 Flume

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/csdnwindnorth/article/details/100599022

版权

一、Flume 简介

1.Flume 提供了一个分布式的，可靠的，对大量数据的日志高效收集，聚集，移动的服务，Flume 只能在 Unix 环境下运行。

2.Flume 基于流式架构，容错性强，也结构简单。

3.Flume，Kafka 用来实时数据收集，Spark，Flume 用来实时处理数据，impala 用来实时查询。

二、Flume 角色

1.source
用于采集数据，source 是产生数据流的地方，同时 source 会将产生的数据流传输到 Channel ，这个类似 java IO 部分的 Channel。

2.Channel
用于桥接 source 和Sink ，类似于一个队列。

3.Sink
从 Channel 收集数据，将数据写到目标源（可以是下一个 source ，也可以是 HDFS 或者 HBase。

4.Event
传输单元，Flume 传输的基本单元，以事件的形式将数据从源头传输到目的地。

三、Flume 传输过程

source 监控某个文件或者数据流，数据源产生新的数据，拿到该数据后，将数据封装到一个 Event 中，并 put 到 Channel 后 commit 提交，Channel 的队列先进先出，Sink 去 Channel 队列拉取数据，然后写入到 HDFS 中。

四、Flume 部署及使用

1.文件配置
查询JAVA_HOME: echo $JAVA_HOME

显示/opt/module/jdk1.8.0_144 /opt/module/jdk1.8.0_144

安装Flume
[itstar@bigdata113 software]$ tar -zxvf apache-flume1.8.0-bin.tar.gz -C /opt/module/

改名：
[itstar@bigdata113 conf]$ mv flume-env.sh.template flume-env.sh

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flume 部署及相关案例

一、Flume 简介1.Flume 提供了一个分布式的，可靠的，对大量数据的日志高效收集，聚集，移动的服务，Flume 只能在 Unix 环境下运行。2.Flume 基于流式架构，容错性强，也结构简单。3.Flume，Kafka 用来实时数据收集，Spark，Flume 用来实时处理数据，impala 用来实时查询。二、Flume 角色1.source用于采集数据，source 是产...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。