Flume学习笔记(二)Flume 常用组件

本文是Flume学习笔记的第二部分,主要介绍Flume的常用组件:Source(包括网络流Source如Avro、Thrift、NetCat和本地文件Source如Exec、Spooling Directory、Taildir)、Sink(数据存储如HDFS、Hive、HBase和数据通讯如Avro、Thrift)以及Channel(JDBC和Kafka Channel)。Flume的这些组件为企业级大数据传输提供稳定和灵活的解决方案。
摘要由CSDN通过智能技术生成

Flume学习笔记(二)Flume 常用组件

前言

​ 上一篇介绍了 Flume 整体的组成架构,这一篇来整理一下一些较为常用的 Source,Sink,Channel

Source

网络流 Source

​ Flume 可以通过监听特定的端口来获取数据,以下三个是较为常用的网络流 Srouce

  • Avro Source

    Avro Source 监听指定端口,通过 RPC 的方式来获取数据,Avro 本身在大批量的数据传输过程中有良好的表现。在实际应用中可以使用 Avro Source 和 Avro Sink 来连接多个 Flume 以传输数据。

  • Thrift Source

    Thrift Source 也是通过监听指定端口然后使用 RPC 的方式来获取数据,与 Avro Source 有些类似,此外其支持 kerberos 认证,具有更高的安全性。

  • NetCat Source

    与上述的 Source 功能类似,同样是通过监听一个端口来获取数据, NetCat 在实际应用中较多且测试非常方便。

本地文件 Source

​ 除了网络流之外,Flume 还能监听本地文件的变化,当被监听的文件或文件夹添加了新内容时 Flume 能将这些内容获取并发送至目的地。

  • Exec Source

    Exec Source 可以执行一条特点的命令来监控文件的内容状况,如 tail -F [file] 这样就能实时的监

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值