flume入门笔记

标签(空格分隔): hadoop


学习三问

flume是什么?
flume干什么?
flume怎么用?

flume官网地址

flume是什么

Apache Flume is a distributed, reliable, and available system for efficiently collecting, aggregating and moving large amounts of log data from many different sources to a centralized data store.
是一个分布式日志汇总,收集器。(对于可靠性的话后续再研究下)。
架构图如下:
![image_1dfabpku218kfv8i77317fim2s9.png-29kB][1]

flume用来干什么

从是什么可以看出来,人家就是拿来收集日志汇总,我们可以对汇众完的日志做统一的分析,挖掘。

flume怎么用(安装使用)

下载一个 apache-flume…tar.gz 包 解压。(依赖java环境)
然后在conf中配置一下你要的配置。一下是一个简单的案例。
netcat.conf

# example.conf: A single-node Flume configuration

# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444

# Describe the sink
a1.sinks.k1.type = logger

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动命令:bin/flume-ng agent -c ./conf -f ./conf/netcat.conf -n a1 -Dflume.root.logger=INFO,console
启动命令这里注意一下,-n(name)必须与配置文件中的代理名字对应 比如这里就是a1上面配置文件要一致。
**测试:**我们可以通过netcat 或者telnet直接连接到端口进行输入测试,看是否成功

flume中有什么(角色就是flume运行机制)

source:来源
sinks:下沉目的地
channel:管道
我们需要从来源获取到需要的日志数据,之后可以通过管道连接到sinks,sinks下沉目的地,但是人家有可能是另一个agent的source,所以flume架构你要向做复杂点完全是可以的。
找个例子:比如有3台web服务器,我们分别搞3个flume收集这三台服务器,之后通过avro的source统一收集,再定义hdfs作为sinks。也就是说通过web集群手机日志,下沉到hdfs上。如下图所示:
![image_1dfacb54r1gb52i915kj1pvtj4f39.png-61.7kB][2]

另三种角色有多种实现方式,具体可参照上面的官网地址查看。当然还有sinks和channel的相关介绍也可看到。
在这里插入图片描述
[1]: http://static.zybuluo.com/luochengyue/drn95f2vrpog4rocgp6opvwb/image_1dfabpku218kfv8i77317fim2s9.png
[2]: http://static.zybuluo.com/luochengyue/37c9dhp5f9vi4j873oshj8vn/image_1dfacb54r1gb52i915kj1pvtj4f39.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值