flume
jy02268879
这个作者很懒,什么都没留下…
展开
-
【十八Spark Streaming实战】日志分析之Flume+Kafka+Spark Streaming+Hbase
【十七Spark Streaming实战】日志分析之用python生成日志对接Python日志产生器输出的日志到Flume1.编写flume agent的配置文件在node1上进入flume目录cd /app/flume/flume/conf创建flume的agent配置文件vi test-streaming-project.conf#streaming-projec...原创 2018-07-23 02:56:17 · 1961 阅读 · 0 评论 -
【十六】Log4j+Flume+Kafka+Spark Streaming(使用Scala语言)
项目目录pom.xml<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apach...原创 2018-07-19 06:02:01 · 543 阅读 · 0 评论 -
【五】Flume使用:将A服务器上的日志实时采集到B服务器上(avro source + avro sink)
agent选择A机器 exec source + memory channel + avro sinkB机器 avro source + memory channel + logger sinkavro source: 监听avro端口,并且接收来自外部avro信息,avro sink:一般用于跨节点传输,主要绑定数据移动目的地的ip和port这里测试的时候准备两台服务器!...原创 2018-07-13 02:59:08 · 1999 阅读 · 2 评论 -
【四】Flume使用:监控文件实时采集新增数据输出到控制台
agent选择:exec source + memory channel + logger sinkexec source 运行一个给定的unix命令memory channel channel中的数据放在内存中logger sink 最终把采集到的数据打印到控制台上创建测试用的日志文件mkdir /app/flume/testDatacd /app/flume/testDatatouch tes...原创 2018-07-13 01:08:14 · 8437 阅读 · 0 评论 -
【三】Flume的使用:从指定的网络端口采集数据输出到控制台
官网介绍官网配置介绍agent配置文件:# example.conf: A single-node Flume configuration# Name the components on this agent# a1是agent的名称# r1是source的名称# k1是sink的名称# c1是channel的名称a1.sources = r1a1.sinks = k1a1.channels = ...原创 2018-07-13 00:25:26 · 2459 阅读 · 0 评论 -
【十三】Spark Streaming整合Flume使用Pull方式(使用Scala语言)
官网地址Spark Streaming整合Flume有两种方式Approach 1: Flume-style Push-based ApproachApproach 2: Pull-based Approach using a Custom Sink这里介绍第二种,生成上优先使用这种方式,因为可靠性比第一种高。这种方式会运行一个自定义的Flume的sink遵循以下步骤1.F...原创 2018-07-18 22:01:49 · 496 阅读 · 1 评论 -
【十二】Spark Streaming整合Flume使用Push方式(使用Scala语言)
官网介绍Spark Streaming整合Flume有两种方式Approach 1: Flume-style Push-based ApproachApproach 2: Pull-based Approach using a Custom Sink这里介绍第一种Spark Streaming在Flume扮演一个avro agent。由于是push模式,需要先启动Spark...原创 2018-07-18 04:46:11 · 399 阅读 · 0 评论 -
【二】Flume安装
环境ubuntu16.04java1.8前置条件:1要用java1.7以及更新的2要有足够的内存供flume使用3要有足够的磁盘供flume使用4flume要有文件及路径的读写权限下载http://archive.apache.org/dist/flume/1.6.0/创建路径mkdir /app/flumecd /app/flume解压tar -zxvf apache-flume-1.6.0-b...原创 2018-07-12 02:10:54 · 220 阅读 · 0 评论 -
【一】Flume理论
官网介绍概述 Flume是一个分布式,高可用的,高可靠的服务,它能高效的收集、聚合、移动大量的日志数据。 它是一个基于流式数据的、简单、灵活的架构。它有健壮的、容错的、从故障中恢复过来的机制。 它有一个灵活扩展的数据模型,可供在线实时分析使用。 最开始由cloudera开发,后来给了apache。开发语言java。同类产品 Scribe 是facebook用c/c++...原创 2018-07-12 01:47:38 · 227 阅读 · 0 评论 -
【六】Flume整合Kafka完成实时数据采集
agent选择A机器 exec source + memory channel + avro sinkB机器 avro source + memory channel avro source: 监听avro端口,并且接收来自外部avro信息,avro sink:一般用于跨节点传输,主要绑定数据移动目的地的ip和port这里测试的时候准备两台服务器!两台都要安装flume。我这里用的是node1服务...原创 2018-07-16 03:17:23 · 2781 阅读 · 0 评论