1.Flume概念,功能,架构

Apache Flume 是一种用于高效收集、聚合和移动大量日志数据的分布式服务。本文介绍了Flume的基本概念,包括其基于流数据的架构,由Source、Channel和Sink组成的Agent角色。此外,还详细讲述了如何配置和编写Flume Agent,包括实时读取数据、将日志存储到HDFS以及按时间分目录存储日志的示例。
摘要由CSDN通过智能技术生成

1.Flume介绍

Flume是一种分布式、可靠且可用的服务,用于有效地收集、聚合和移动大量日志数据。它是基于流数据的灵活架构。它具有高可靠性机制和许多故障转移及恢复机制,具有强大的容错能力。它使用简单的可扩展数据模型,允许在线分析应用程序。

2.Flume架构

Flume-ng只有一个角色的节点:Agent角色。Agent角色有Source、Channel、Sink组成。

  • Source:用于采集数据,Source是产生数据流的来源方,同时将产生的数据流传输到Channel。
  • Channel:连接Sources和Sinks,这个管道类似与一个队列。
  • Sink:从Channels收集数据,将数据写到目标源,可以是下一个Source也可以是HDFS或HBASE。

Event是Flume数据传输的基本单元,Flume以Event的形式将数据从源头传送到最终目的地。Event由(可选的)Header和载有数据的一个Byte Array组成。

  • 载有的数据对Flume是不透明的
  • Header是容纳了key-value的无序集合,key在集合内是唯一的
  • Header可以在上下文路由中扩展

3.Apache Flume安装配置

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值