Flume基础:source,sink,channel

Flume是向Hadoop批量导入基于事件的海量数据。一个典型的例子就是从一组web服务器中收集日志文件,然后把这些文件中的日志事件转移到一个新的HDFS汇总文件中作进一步处理,其终点通常被称为HDFS.

 

Flume代理是由持续运行的source(数据源)、sink(数据目标)以及channel(用于连接sink和source)构成的java进程。Flume的source产生事件,并将其传送给channnel,channel存储这些事件直至转发给sink。可以把source-channel-sink的组合视为基本的Flume组件。

类别组件描述
SourceAvro监听由Avro sink或Flume SDK通过Avro rpc发送的事件所抵达的端口
 Exec运行一个unix命令,并把从标准输出上读取的行转换为事件。请注意,此source不能保证事件被传递到channel,更好的选择可以参考spooling directory或flume sdk
HTTP监听一个端口,并使用可插拔句柄把http请求转化为事件
JMS读取来自JMS Queue 或topic的消息并将其转化为事件
sinkavro 通过avro rpc发送事件到一个avro source
Netcat监听一个端口,并把每行文问你转换为一个事件
Sequence generator依据增量计数器来生成事件。对测试有用
channelFile将事件储存在一个本地文件系统上的事务日志中
JDBC将事件储存在数据库中(嵌入式derby)
memory将事件储存在一个内存队列中

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值