flume
rolin-刘瑞
技术GEEK
展开
-
flume安装
简介Flume是Cloudera提供的一个分布式、可靠、和高可用的海量日志采集、聚合和传输的日志收集系统,支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。下图为flume典型的体系结构:Flume数据源以及输出方式:Flume提供了从console(控制台)、RPC(Thrift-RPC)、text(文原创 2014-07-20 19:26:57 · 6574 阅读 · 0 评论 -
基于Flume的美团日志收集系统(二)改进和优化
在《基于Flume的美团日志收集系统(一)架构和设计》中,我们详述了基于Flume的美团日志收集系统的架构设计,以及为什么做这样的设计。在本节中,我们将会讲述在实际部署和使用过程中遇到的问题,对Flume的功能改进和对系统做的优化。1 Flume的问题总结在Flume的使用过程中,遇到的主要问题如下:a. Channel“水土不服”:使用固定大小的MemoryChannel在日志高峰时常报队列大小...转载 2018-04-18 18:52:28 · 6289 阅读 · 0 评论 -
基于Flume的美团日志收集系统(一)架构和设计
美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流。美团的日志收集系统基于Flume设计和搭建而成。《基于Flume的美团日志收集系统》将分两部分给读者呈现美团日志收集系统的架构设计和实战经验。第一部分架构和设计,将主要着眼于日志收集系统整体的架构设计,以及为什么要做这样的设计。第二部分改进和优化,将主要着眼于转载 2018-04-18 18:51:20 · 9377 阅读 · 0 评论 -
Flume之监控
Flume作为一个日志收集工具,在数据采集方面,展现出了非常强大的能力。它的SOURCE、SINK、CHANNEL三大组件这种模式,来完成数据的接收、缓存、发送这个过程,拥有非常完美的契合度。不过这里,我们要说的不是Flume有多好或者Flume有哪些优点,我们要谈的是Flume的监控。1、为什么需要Flume监控?Flume作为一个强大的数据收集工具,虽然功能非常强大实用,但是却转载 2017-10-26 15:44:05 · 9034 阅读 · 1 评论 -
Flume Channel Selectors使用
前几篇文章只有一个项目的日志,现在我们考虑多个项目的日志的收集,我拷贝了一份flumedemo项目,重命名为flumedemo2,添加了一个WriteLog2.java类,稍微改动了一下JSON字符串的输出,将以前requestUrl中的"reporter-api"改为了"image-api",以便和WriteLog类的输出稍微区分开来,如下:[java] view plain转载 2017-10-26 14:55:00 · 6038 阅读 · 0 评论 -
Flume Interceptors的使用
对于flume拦截器,我的理解是:在app(应用程序日志)和 source 之间的,对app日志进行拦截处理的。也即在日志进入到source之前,对日志进行一些包装、清新过滤等等动作。官方上提供的已有的拦截器有:Timestamp InterceptorHost InterceptorStatic InterceptorRegex Filtering Intercept转载 2017-10-26 14:53:37 · 6364 阅读 · 0 评论 -
记录Flume使用KafkaSource的时候Channel队列满了之后发生的怪异问题
Flume的这个问题纠结了2个月,因为之前实在太忙了,没有时间来研究这个问题产生的原理,今天终于研究出来了,找出了这个问题所在。先来描述一下这个问题的现象:Flume的Source用的是KafkaSource,Sink用的是Custom Sink,由于这个Custom Sink写的有一点小问题,比如batchSize是5000次,第4000条就会发生exception,这样每次都会写入40转载 2017-06-19 22:40:24 · 14571 阅读 · 0 评论 -
Flume-ng 高级功能
看看flume的高级功能:1 flume channel selectors如果没有特殊说明,则默认是replicating模式。 还有Multiplexing、Custom模式可以选择。1 Replicating Channel Selector需要设置以下的属性:selector.type 默认值是replicating,用来设转载 2016-12-15 15:44:07 · 7482 阅读 · 0 评论 -
对flume1.6改造,添加Taildir功能
使用更改后的TaildirSource,可以递归地监听配置目录的动态变化的文件。需求描述使用了SpoolDirectorySource可以配置一个监听目录,会监听该目录下所有的文件,但是如果配置目录下面嵌套了子目录,则无法监听,通过修改源码,我们可以递归地对配置目录的所有子目录的所有文件进行监听,见上一篇文章 Flume的Spooling Directory Source支持Sub转载 2016-11-30 12:08:36 · 8229 阅读 · 0 评论 -
伪分布式系列 - 第六篇 - flume-1.9.0-环境搭建
目录环境准备下载flumeflume配置启动测试环境准备下载flume下载地址:http://flume.apache.org/download.html http://mirror.bit.edu.cn/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz版本:1.9.0flume配置启动测试...原创 2019-08-02 21:12:02 · 6536 阅读 · 0 评论
分享