日志收集分析系统架构

日志收集分析系统架构

 

一.部署架构

    日志收集系统一般包括如图所示三层。Web服务器层,日志收集层,日志存储层。Web服务器层是日志的来源,一般部署web应用供用户访问,产生日志,该节点上一般需要部署日志收集程序的agent。日志收集层手机web服务器产生的日志传输给日志存储层,存储层一般使用分布式文件系统HDFS,日志可以存储在hdfs上或者hbase上。

scribe作为日志收集系统架构,scribe分为scribe agentscribe server

kafka作为日志收集系统架构,kafka分为:producerkafka serverconsumer

flume作为日志收集系统的架构

三种日志收集服务对比

 

Scribe

Kafka

Flume

开源公司

Facebook

Linkedin

Cloudera

开源时间

0810

1012

097

实现语言

C/C++

SCALA

JAVA

框架

Push/push

Push/pull

Push/push

容错性

Collectorstore之间有容错机制,而agentcollector之间的容错机制需要用户自己来实现

Agent可通过自动识别机制获取可用的collectorStore自己保存已经获取数据的偏移量,一旦collector出现故障可根据偏移量继续获取数据,

Agentcollectorcollectorstore之间均有容错机制,并且提供了三种级别的可容错性保证。

负载均衡

Zookeeper

Zookeeper

可扩展性

Agent

Thrift

用户根据kafka提供的low-levelhigh-level api自己实现

提供了各种丰富的agent

Collector

实际上是一个thrift server

直接支持hdfs

直接支持hdfs

Store

直接支持hdfs

直接支持hdfs

直接支持hdfs

总体评价

设计简单,易于使用,但容错和负载均衡方面不够好。且资料较少

采用push/pull架构,可以重复获取数据,但是产品较新,稳定性需要验证

Very good

 

2. 日志分析常使用的计算框架

离线计算:mapreducehivepig

近实时计算:sparkimpala

实时计算:storm

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值