Flume
王傲旗的大数据之路之Flume专栏
Ai之家-开箱测评
这个作者很懒,什么都没留下…
展开
-
Flume的负载均衡load balancer
负载均衡是用于解决一台机器(一个进程)无法解决所有请求而产生的一种算法。Load balancing Sink Processor 能够实现 load balance 功能,如下图Agent1 是一个路由节点,负责将 Channel 暂存的 Event 均衡到对应的多个 Sink组件上,而每个 Sink 组件分别连接到一个独立的 Agent 上示例配置,如下所示:![在此处我们通过三台...原创 2019-12-05 18:12:51 · 5037 阅读 · 0 评论 -
Flume配置高可用Flum-NG配置failover
在完成单点的Flume NG搭建后,下面我们搭建一个高可用的Flume NG集群,架构图如下所示:图中,我们可以看出,Flume的存储可以支持多种,这里只列举了HDFS和Kafka(如:存储最新的一周日志,并给Storm系统提供实时日志流)。角色分配Flume的Agent和Collector分布如下表所示:名称HOST角色Agent1node01Web Se...原创 2019-12-05 17:23:40 · 4807 阅读 · 0 评论 -
Flume实现两个agent级联采集
1.先附一张效果图第一个agent负责收集文件当中的数据,通过网络发送到第二个agent当中去,第二个agent负责接收第一个agent发送的数据,并将数据保存到hdfs上面去2.开始实操 先在两个节点安装FlumeFlume的入门安装教程此时我们已经安装好了两个节点主节点 : node09从节点 : node10第一步:node10配置flume配置文件1.进入到F...原创 2019-12-05 16:19:19 · 5265 阅读 · 0 评论 -
Flume的多种采集方式
1.采集目录到HDFS采集需求:服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去根据需求,首先定义以下3大要素:采集源,即source——监控文件目录 : spooldir下沉目标,即sink——HDFS文件系统 : hdfs sinksource和sink之间的传递通道——channel,可用file channel 也可以用内...原创 2019-12-04 22:41:58 · 5769 阅读 · 0 评论 -
Flume的运行机制与采集系统结构
1.运行机制Flume系统中核心的角色是agent,agent本身是一个Java进程,一般运行在日志收集节点。每一个agent相当于一个数据传递员,内部有三个组件:Source:采集源,用于跟数据源对接,以获取数据;Sink:下沉地,采集数据的传送目的,用于往下一级agent传递数据或者往最终存储系统传递数据;Channel:agent内部的数据传输通道,用于从source将数据...原创 2019-12-04 22:14:00 · 4895 阅读 · 0 评论 -
Flume的安装入门教程
1.什么是flume?Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的软件。Flume的核心是把数据从数据源(source)收集过来,再将收集到的数据送到指定的目的地(sink)。为了保证输送的过程一定成功,在送到目的地(sink)之前,会先缓存数据(channel),待数据真正到达目的地(sink)后,flume在删除自己缓存的数据。Flume...原创 2019-12-04 22:03:38 · 5204 阅读 · 0 评论 -
-bash: telnet: command not found
截图封上原因 :没有安装telnet服务解决方案yum install telnet-server -yyum install telnet.* -yyum install telnet-server 安装telnet服务yum install telnet.* 安装telnet客户端...原创 2019-12-04 20:43:55 · 5139 阅读 · 1 评论
分享