一些高大上的日志系统收集

日志系统基本可以分为两类:传统日志系统和分布式日志系统,本节我们研究分布式日志系统的相关开源实现,主要分析facebook的scribe和apache的机遇Hadoop的chukwa。

      facebook的scribe

      简单描述:Scribefacebook开源的日志收集系统,在facebook内部已经得到大量的应用。它能够从各种日志源上收集日志,存储到一个中央存储系统(可以是NFS,分布式文件系统等)上,以便于进行集中统计分析处理。它为日志的分布式收集,统一处理提供了一个可扩展的,高容错的方案。

      系统架构:

 

 

      基本概念:

           LocalServer和Central Server都是基于Thrift框架来实现

           Client可以基于众多编程语言实现,官方提供Python实现

           Scribe提供高容错性

           信息处理最终汇集在Central Server端,这个系统模型可以水平扩展和多级报告。支持Hadoop海量数据分析。

     

      apache的chukwa

      简单描述:

      chukwa是一个非常新的开源项目,由于其属于hadoop系列产品,因而使用了很多hadoop的组件(用HDFS存储,用mapreduce处理数据),它提供了很多模块以支持hadoop集群日志分析。

     

      架构分析:

 

 

 

 

Chukwa has five primarycomponents:

·Agents that run on each machine and emit data.

·Collectors that receive data from the agent and write it tostable storage.

·ETL Processes for parsing and archiving the data.

·Data Analytics Scripts for aggregate Hadoop cluster health.

·HICC, the Hadoop Infrastructure Care Center; a web-portal styleinterface for displaying data.

Below is a figure showing the Chukwa data pipeline,annotated with data dwell times at each stage. A more detailed figure isavailable at the end of this document.

 

 

 

      学习结论:环境搭建比较简单。但依赖Hadoop集群。如果要启用其HICC图形接口,则依赖HBase集群。

 

 

 

      其他开源实现:

      linkedinkafka

      clouderaflume

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值