做电商数仓项目时,遇到了一个奇怪的问题,flume消费kafka时,在hdfs上没有传递过来数据,这样我很头疼,经过测试,我发现在kafka中可以读取到日志采集flume发过来的数据,这就证明在消费flume之前的配置是没有问题的,后来我找到了问题所在。
由于是才有脚本群起的集群,在生成日志时,消费者flume由于没有完全启动的原因,使其在消费数据时不成功,所以应该在群起脚本中设置sleep时间,或者将sleep的值调大,如果还不可以
就将f2在脚本中去除,在生成日志后单独启动f2,这样问题就解决了!