Chukwa_Flume
文章平均质量分 81
用心工作-快乐生活
这个作者很懒,什么都没留下…
展开
-
日志分析方法概述
日志在计算机系统中是一个非常广泛的概念,任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同,很难一概而论。本文讨论的日志处理方法中的日志,仅指Web日志。其实并没有精确的定义,可能包括但不限于各种前端Web服务器——apache、lighttpd、tomcat等产生的用户访问日志,以及各种Web应用程序自己输出的日志。在Web日志中,每条日志通常代转载 2014-03-13 10:46:37 · 789 阅读 · 1 评论 -
开源日志采集系统比较:scribe、chukwa、kafka、flume
1. 背景介绍许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征:(1)构建应用系统和分析系统的桥梁,并将它们之间的关联解耦;(2)支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统;(3)具有高可扩展性。即:当数据量增加时,可以通过增加节点进行水平扩展。本文从设计架构转载 2014-03-14 16:25:09 · 1984 阅读 · 0 评论 -
hadoop状态分析系统chukwa (日志收集存储分析系统)
Apache 的开源项目 hadoop, 作为一个分布式存储和计算系统,已经被业界广泛应用。很多大型企业都有了各自基于 hadoop 的应用和相关扩展。当 1000+ 以上个节点的 hadoop 集群变得常见时,集群自身的相关信息如何收集和分析呢?针对这个问题, Apache 同样提出了相应的解决方案,那就是 chukwa。述 chukwa 的官方网站是这样描述自己的: chukwa 是一转载 2014-03-18 17:13:03 · 1846 阅读 · 0 评论 -
Flume使用指南
Flume 1.4.0 User GuideIntroductionOverviewApache Flume is a distributed, reliable, and available system for efficiently collecting, aggregating and moving large amounts of log data from转载 2014-03-20 16:49:03 · 2545 阅读 · 0 评论 -
Chukwa在百度的应用实践
从上一篇 chukwa 的简介中,我们知道 chukwa 为日志分析系统提供了一整套的解决方案,其中包含了数据的生成、收集、排序、去重、分析和展示所需要的几乎所有事情,要扩展 chukwa 以实现自己特殊的需求,是很方便的.本文以 chukwa-0.3.0 为例,阐述在 分布式小组内如何以 chukwa 为基础实现"资源状态图"。概述需求"资源状态图"的需求是很明确的,具体分析如下:转载 2014-03-18 17:14:53 · 772 阅读 · 1 评论 -
Cloudera Flume简介
Flume是Cloudera提供的日志收集系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 Flume是一个分布式、可靠、高可用的海量日志采集、聚合和传输的系统。上图的Flume的Architecture,在Flume中,最重要的抽象是data flow(数据流),data flow描述了数转载 2014-03-20 16:43:22 · 1097 阅读 · 0 评论 -
flume1.4.0安装及简单使用
Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统,flume-ng是flume的新版本的意思,其中“ng”意为new generate(新一代),目前来说,flume1.4.0是最新的版本。1.下载安装包 可以到官网http://www.apache.org/dist/flume/stable/网站下载安装包:apache-flume-1.4.0-bin.tar.g原创 2014-03-21 13:49:38 · 1626 阅读 · 0 评论