问题描述:为了节约服务器上使用flume占用的资源,希望减少flume产生的JVM进程。故将几个数据采集的需求都写在一个agent的配置文件中了。其中每一个单独执行的时候都没有任何问题。但是把agent的名字统一直接堆砌到一起之后发现收集数据的系统中仅仅有一个数据到位了。
问题原因:
1.agent 申明source、sink、channel变量的时候一定要一句全部申明,并用空格隔开。
例如错误示范:
# Sources, channels, and sinks are defined per
# agent name, in this case 'user_center_log'.
user_center_log.sources = source1
user_center_log.channels = channel1
user_center_log.sinks = sink1
#----------------------------------------------------------
# 因为flume申明变量的时候是覆盖式的,所以以上的任何申明都会被下面覆盖。
# 所以后续对source、sink等进行描述的时候,也只有一套source、sink生效。
user_center_user_info.sources = source2
user_center_user_info.channels = channel2
user_center_user_info.sinks = sink2
正确申明情况:
# Sources, channels, and sinks are defined per
# agent name, in this case 'user_center_log'.
user_center_log.sources = source1 source2
user_center_log.channels = channel1 channel2
user_center_log.sinks = sink1 sink2
问题总结:
因为自以为配置的很多大数据组件都是随时申明的,所以在遇到这个问题的时候也没有第一时间查查问题,而是重复检查配置、检查log之类的错误方向,耽误了一个小时左右的工作时,果然对没有深入学习的东西还是要多找找资料看看。