Flume-概述与简单实践

一、Flume产生背景

各种Server(WebServer/ApplicationServer)分散在各个机器上,想要在大数据平台Hadoop进行统计分析,日志如何收集到Hadoop平台上,可以采用Flume。

二、Flume概述

分布式、高可靠、高可用的服务,用于分布式的海量日志的高效收集、聚合、移动。其容错性、可靠性、扩展性、管理性等非常好。

三、Flume架构及核心组件

1)官网架构
在这里插入图片描述
2)核心组件
Source:收集
Channel:聚集
Sink:输出
Flume实践

四、实践:将A服务器上的日志实时采集到B服务器上

1)条件:两台服务器:slave01(A)、slave02(B)
2)类型选型:跨节点传输
A:exec source + memory channel + avro sink
B:avro source + memory channel + logger sink
3)配置文件:服务器A
在这里插入图片描述
4)配置文件:B

5)开启flume
先启动B,再启动A,否则会报连接被拒绝的错误。
启动B

flume-ng agent --name a1 --conf /home/gxx/apache-flume-1.8.0-bin/conf --conf-file /home/gxx/apache-flume-1.8.0-bin/conf/A-exec-B-logger.conf -Dflume.root.logger=INFO,console

启动A

flume-ng agent --name a1 --conf /home/gxx/apache-flume-1.8.0-bin/conf --conf-file /home/gxx/apache-flume-1.8.0-bin/conf/A-exec-B-logger.conf -Dflume.root.logger=INFO,console

6)往A的test.txt文件输入文本,会在B的控制台处看到

echo spark>>test.txt

7)注意⚠️

  • 先启动B,再启动A,否则会报连接被拒绝的错误。
  • A的sink是hostname,B的source是bind
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值