一些高大上的日志系统收集

最新推荐文章于 2024-07-30 15:51:04 发布

艾比aibi

最新推荐文章于 2024-07-30 15:51:04 发布

阅读量1.9k

点赞数

文章标签：分布式文件系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aibisoft/article/details/40430611

版权

日志系统基本可以分为两类：传统日志系统和分布式日志系统，本节我们研究分布式日志系统的相关开源实现，主要分析facebook的scribe和apache的机遇Hadoop的chukwa。

facebook的scribe

简单描述：Scribe是facebook开源的日志收集系统，在facebook内部已经得到大量的应用。它能够从各种日志源上收集日志，存储到一个中央存储系统（可以是NFS，分布式文件系统等）上，以便于进行集中统计分析处理。它为日志的“分布式收集，统一处理”提供了一个可扩展的，高容错的方案。

系统架构：

基本概念：

LocalServer和Central Server都是基于Thrift框架来实现

Client可以基于众多编程语言实现，官方提供Python实现

Scribe提供高容错性

信息处理最终汇集在Central Server端，这个系统模型可以水平扩展和多级报告。支持Hadoop海量数据分析。

apache的chukwa

简单描述：

chukwa是一个非常新的开源项目，由于其属于hadoop系列产品，因而使用了很多hadoop的组件（用HDFS存储，用mapreduce处理数据），它提供了很多模块以支持hadoop集群日志分析。

架构分析：

Chukwa has five primarycomponents:

·Agents that run on each machine and emit data.

·Collectors that receive data from the agent and write it tostable storage.

·ETL Processes for parsing and archiving the data.

·Data Analytics Scripts for aggregate Hadoop cluster health.

·HICC, the Hadoop Infrastructure Care Center; a web-portal styleinterface for displaying data.

Below is a figure showing the Chukwa data pipeline,annotated with data dwell times at each stage. A more detailed figure isavailable at the end of this document.

学习结论：环境搭建比较简单。但依赖Hadoop集群。如果要启用其HICC图形接口，则依赖HBase集群。

其他开源实现：

linkedin的kafka

cloudera的flume

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。