数据采集阶段技术对比(flume,kafka,sqoop)

数据采集技术

数据收集架构

 

Kafka架构图

集群由zookeeper管理

Kafka的特点:

1. 磁盘存储

2. 高吞吐率(每秒几十万条消息)

3. 分布式架构,能对消息进行分析

4. 将数据并行加载到hadoop分区

 

Flume 架构图

1. agent:就是将数据源的数据发送给collector

2. Collector:将数据源汇总给storage

3. Storage :存储数据

4. Master管理整个集群

 

Flume设计目标

可靠性:就是发生故障自动转移,当发生节点故障了,会传到其他节点,日志数据不会丢失

End-to-end:agent数据,当我们的数据传送成功后,就删除。如果传送是失败了,就重新发送

Store on failure:

Best effort

 

Sqoop 架构图

 

常见日志收集系统对比

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值