Flume Source

一、 Avro Source

  1. 监听AVRO端口,接受来自外部AVRO客户端的事件流。
  2. 是实现多级流动、扇出流、扇入流等效果的基础
  3. 另外也可以接受通过flume提供的Avro客户端发送的日志信息。
  4. Avro Source 接收到的是Avro格式的数据,需要Avro反序列化为原来的格式,与Avro Sink配合使用
    在这里插入图片描述
    a.配置Agent
    在这里插入图片描述b.启动Agent
    在这里插入图片描述
    c.通过Avro-Client测试
    在这里插入图片描述

二、Exec Source

可以将命令产生的输出作为源
在这里插入图片描述a.配置Agent
在这里插入图片描述b.启动Agent
在这里插入图片描述

三、Spooling Directory Source

  1. 这个Source允许你将将要收集的数据放置到"自动搜集"目录中。这个Source将监视该目录,并将解析新文件的出现。
  2. 事件处理逻辑是可插拔的,当一个文件被完全读入信道,它会被重命名或可选的直接删除。
  3. 要注意的是,放置到自动搜集目录下的文件不能修改,如果修改,则flume会报错。
  4. 另外,也不能产生重名的文件,如果有重名的文件被放置进来,则flume会报错。
    在这里插入图片描述

四、NetCat Source

一个NetCat Source用来监听一个指定端口,并将接收到的数据的每一行转换为一个事件。
在这里插入图片描述

五、Sequence Generator Source – 序列发生器源

  1. 一个简单的序列发生器,不断的产生事件,值是从0开始每次递增1。
  2. 主要用来进行测试。
    在这里插入图片描述配置Agent
    在这里插入图片描述

六、HTTP Source

  1. 此Source接受HTTP的GET和POST请求作为Flume的事件。
  2. 其中GET方式应该只用于试验。
    在这里插入图片描述需要提供一个可插拔的"处理器"来将请求转换为事件对象,这个处理器必须实现HTTPSourceHandler接口。
    常见的Handler:
    在这里插入图片描述配置Agent
    在这里插入图片描述通过curl命令测试
    在这里插入图片描述

七、Custom Source

  1. 如果以上内置的Source都不能满足需求,可以自己开发Source
  2. 按照Flume要是写一个类实现相应接口。
  3. 将类打成jar放置到flume的lib目录下。
  4. 在配置文件中通过类的全路径名加载Source。
    在这里插入图片描述
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值