尝试使用Flume 1.3

flume ng是在flume og的基础上做的一个非常大的重构,基本上属于重写了。他和OG相比,简单了不少,但是随之用于管理的功能也少了不少,因为现在使用的是基于plugin的模式来设计,所以管理的功能可能会留待以后由第三方来做,flume只实现最核心的“传输”功能。OG中先前的master,zookeeper等都没有了,NG中只能使用本地的一个properties文件来配置

 

安装上之后,写个配置文件简单尝试了一下,source使用spoolDir,channel使用memory,sink使用hdfs,结果问题不断,只能说使用flume做数据采集,“坑很深”,或很考验“经验”

a1.sources =  r1
a1.sinks = k1
a1.channels = c1

a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir = /var/log/apache/flumeSpool
a1.sources.r1.fileHeader = true

a1.sources.r1.interceptors = i1 i2
a1.sources.r1.interceptors.i1.type = org.apache.flume.interceptor.HostInterceptor$Builder
a1.sources.r1.interceptors.i1.preserveExisting = false
a1.sources.r1.interceptors.i1.hostHeader = hostname
a1.sources.r1.interceptors.i2.type = org.apache.flume.interceptor.TimestampInterceptor$Builder

a1.sinks.k1.type = hdfs 
a1.sinks.k1.hdfs.path = hdfs://server240:9000/tmp/flume
a1.sinks.k1.hdfs.rollInterval = 0 
a1.sinks.k1.hdfs.idleTimeout=60
a1.sinks.k1.hdfs.rollSize = 0 
a1.sinks.k1.hdfs.rollCount = 0 
a1.sinks.k1.hdfs.writeFormat = Text 
a1.sinks.k1.hdfs.fileType = DataStream

a1.channels.c1.type = file

a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

 

首先,拷贝到同步路径下时,不能使用cp,因为文件还没有拷贝完,flume就会识别到新生成了一个文件,于是开始同步。。。所以最好使用cp -s,或ln -s建立一个链接

其次,如果仍进去一个二进制的文件,报错不断,可能因为spoolDir采用的是readLine的方式,在二进制文件上readLine,不清楚会发生什么问题。。。似乎和事务有关,反正传输完之后从hdfs里面取出文件,和源文件对比发现MD5变了,将memory channel换成file channle,结果依然不对。

另外,传输1G的存文本文件,使用spoolDir+memory,性能也不敢恭维

 

可能我使用的方式不对,网上说传输文件应该使用avro-client的方式,但是还没有尝试,但是不管如何,要想使用flume1.3来做采集,需要深入的仔细研究清楚才可以进行,否则容易栽跟头。。。有深入研究过的朋友,可以深入探讨一下

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕业设计,基于SpringBoot+Vue+MySQL开发的校园二手书交易平台,源码+数据库+毕业论文+视频演示 信息数据从传统到当代,是一直在变革当中,突如其来的互联网让传统的信息管理看到了革命性的曙光,因为传统信息管理从时效性,还是安全性,还是可操作性等各个方面来讲,遇到了互联网时代才发现能补上自古以来的短板,有效的提升管理的效率和业务水平。传统的管理模式,时间越久管理的内容越多,也需要更多的人来对数据进行整理,并且数据的汇总查询方面效率也是极其的低下,并且数据安全方面永远不会保证安全性能。结合数据内容管理的种种缺点,在互联网时代都可以得到有效的补充。结合先进的互联网技术,开发符合需求的软件,让数据内容管理不管是从录入的及时性,查看的及时性还是汇总分析的及时性,都能让正确率达到最高,管理更加的科学和便捷。本次开发的校园二手书交易平台实现了图书信息查询。系统用到了关系型数据库中MySql作为系统的数据库,有效的对数据进行安全的存储,有效的备份,对数据可靠性方面得到了保证。并且程序也具备程序需求的所有功能,使得操作性还是安全性都大大提高,让校园二手书交易平台更能从理念走到现实,确确实实的让人们提升信息处理效率。 关键字:信息管理,时效性,安全性,MySql;Spring Boot
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值