Flume
文章平均质量分 95
flume
May--J--Oldhu
这个作者很懒,什么都没留下…
展开
-
Flume(简介,特点,架构,原理,组件,工作流程,拦截器,flume可靠性)
25.Flume一.Flume简介1.Flume是什么?Apache Flume是一个分布式的,可靠性的,可用的数据收集系统,它可以有效地收集,聚合和移动大量的日志数据,这些数据可以从许多不同的来源转移到一个集中的数据存储中。Apache Flume不仅仅限于日志数据集合。由于数据源是可定制的,所有Flume可用于传输大量事件数据,包括但不限于网络流量数据,社交媒体生成的数据,电子邮件消息以及几乎所有可能的数据源。2.Flume特点(1)可靠性Flume的核心是把**数据从数据源收集过来,再送原创 2021-02-03 15:47:58 · 3147 阅读 · 0 评论 -
Flume拦截器(正则过滤拦截器,使用idea自定义拦截器)
Flume拦截器一.使用正则拦截器(去掉首行)二.自定义拦截器1.创建maven工程2.在idea中自定义编写拦截器3.打成jar包传到$FLUME_HOME/lib 目录下4.编写agent文件5.执行结果一.使用正则拦截器(去掉首行)需求:使用Spooling directory source监督符合格式的文件进行上传(格式:user_年-月-日.csv);使用正则拦截器去除首行;使用file channel进行缓存;以规定的文件格式()上传到HDFS上规定文件夹下[root@hadoop原创 2020-12-01 19:47:38 · 881 阅读 · 0 评论 -
Flume配置(NetCatSource,ExecSource,SqoolingDirectory,MemoryChannel, FileChannel,LoggerSink,HDFS Sink )
Flume组件的配置示例一.Flume组件的配置示例1.NetCat TCP Source,Memory Channel,Logger Sink1)NetCat TCP Source2)Memory Channel3)Logger Link2.Exec Source,Memory Channel,Logger Sink1)Exec Source2)Memory Channel3.Spooling Directory Source,File Channel,Logger Link1)Spooling Dire原创 2020-11-30 21:49:30 · 436 阅读 · 0 评论 -
Flume简介及安装
Flume简介及安装一.Flume简介1.什么是Flume?2.Flume架构二.Flume安装及环境配置1.准备安装包flume-ng-1.6.0-cdh5.14.0.tar.gz2.解压flume安装包3.修改配置文件一.Flume简介1.什么是Flume?flume 作为 cloudera 开发的实时日志收集系统,用于将多种来源的日志以流的方式传输至Hadoop或者其他目的地2.Flume架构Client:客户端,数据产生的地方,如Web服务器Event:事件,指通过Agent传输的单个原创 2020-11-30 21:40:52 · 255 阅读 · 0 评论