flume的安装及使用

最新推荐文章于 2023-09-30 11:32:10 发布

G_scsd

最新推荐文章于 2023-09-30 11:32:10 发布

阅读量593

点赞数

分类专栏： flume 文章标签： flume的安装及使用监控网络、文件、文件夹

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gscsd_T/article/details/80097214

版权

flume 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Flume是什么？

Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方(可定制)的能力。

说白了flume就是可以从某个地方收集数据，再经过一个叫channel的通道后，将数据给某个东西，下面有张结构图，流程叫agent，包含三个东西，分别是source、channel、sink，眼神好使的估计已经看出他的结构流程了，source是获取数据，channel是通道，传输数据的，sink是把数据给谁的。

agent:

source type:监控文件监控网络 thirft avro 或自定义（获取资源）

channle type:内存（管道—传输资源）

sink type：kafka hdfs mysql数据库（将传输过来的资源交给谁）

接下来我们开始安装和使用flume了

1. 将flume压缩包传输到Linux的hadoop用户下

2. 将压缩包解压到opt目录下

然后就会在opt目录下看到一个文件夹

3. 配置agent

首先进入conf目录，在该目录下新建一个文件，名字为a1.conf

然后就可以使用flume了，这个就看如何配置这个a1.conf这个文件了

监听网络：

这里主要看source的参数，配置了监听的类型，监听的主机，监听主机的端口

接着我们来启动一下

./bin/flume-ng agent -c conf -f conf/a1.conf -n a1 -Dflume.root.logger=INFO,console

然后我们就远程到python这台主机上，回车一下就可以进行监听了，可以任意发送数据，flume那边都能看到

监听文件：

和上面一样，只需要改动数据的来源端即source的配置即可，设置路径为/home/hadoop/a1.test，所以我们要新建一个名为a1.test的文件

接着我们启动flume

然后我们对a1.test文件进行写操作

随即启动flume的那个窗口会出现一个感叹号，说明进行了操作，然后我们就会看到我们写入的信息

也可看下该文件里面的数据

监听目录：

只需修改source即可

这里我们写了一个文件夹为a1_test,所以在该路径下新建这个文件夹

接着启动flume

新建一个文件名为aaa

顺便再写点数据在里面

esc+shift+ZZ，保存并退出

然后将该文件移动到我们监听的那个目录里面去

随后便发现我们写入的数据

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

G_scsd CSDN认证博客专家 CSDN认证企业博客

码龄7年

121: 原创

3万+: 周排名

3万+: 总排名

51万+: 访问

: 等级

5587: 积分

298: 粉丝

339: 获赞

257: 评论

1363: 收藏

私信

关注

热门文章

分类专栏

MySQL 1篇
python 66篇
大数据 1篇
pyspark 16篇
Mongo 1篇
ElasticSearch 1篇
docker 2篇
tornado 1篇
python学习 30篇
MySQL数据库 9篇
Django 16篇
Linux 5篇
hadoop 13篇
spark 7篇
Hive 5篇
kafka 2篇
flume 2篇
爬虫 18篇
java 1篇
学习 6篇
程序人生 1篇

最新评论

Python连接MySQL数据库连接池
G_scsd: 应该是，具体的你可以问问ChatGPT，相信能给你更好的答案
Python连接MySQL数据库连接池
魣鮟: 大佬您的意思是不管是不是不同的连接事务都会持续的运行下去是吗
Python连接MySQL数据库连接池
G_scsd: 那有可能是你用的时候刚好连接池断掉了，你加个异常等待试试
Python连接MySQL数据库连接池
魣鮟: 这样吗大佬，我实验的结果是新生成的连接并不能支持当前事务继续执行下去了，会抛出错误来。。。这是啥情况嘞？？
Python连接MySQL数据库连接池
G_scsd: 如果连接池不可用，服务会在超时结束前等待有效的连接池过来，连接是新的，你可以把连接看做一个令牌，有就行，不用管是不是新旧，只要有效会就接着执行，更何况你还没提交呢

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。