flume flume跨服务器采集数据:多个agent串联

本文介绍了如何使用Flume进行跨服务器的数据采集,通过示意图和具体代码展示了一个Agent从数据源采集文件,然后通过网络传输到另一个Agent,最终将数据存储到HDFS的过程。在配置中强调了Agent间的端口一致性和启动顺序,以及网络传输的注意事项。
摘要由CSDN通过智能技术生成

前言

在大数据的采集中,我们常用Flume来进行数据的采集,一般的我们会从Web Server服务器中收集数据,将数据存储在另一台服务器的hdfs文件系统做离线分析或者sink到另一台服务器的kafka消息队列中做实时流式计算

示意图

两个agent串联

在这里插入图片描述

多个agent串联到一个agent

在这里插入图片描述

需求

  • 第一个agent负责收集文件当中的数据,通过网络发送到第二个agent当中去
  • 第二个agent负责接收第一个agent发送的数据,并将数据保存到hdfs上面去

注意
两个agent不在同一个节点,端口要一样

注释
跨网络传输一定要先传到avro么,不能直接传到hdfs?
没法直接到hdfs上面去

代码

第一个agent负责从数据源采集文件并传输到第二个agent


                
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值