在上篇博客中,我们还留了一个小疑问,就是我们对最后一个flume的优化是如何做的,关于这一点,我们的思路是这样的,file的瓶颈是io,而我们使用的硬盘是5400转1t硬盘,如果想要优化,我们必须找到性能和memory相当,但是又能较好的保存数据,保证事务性的channel,符合这样要求的一款channel进入了我们的视线,就是kafkachannel,具体怎么做的,请大家看详细介绍:
优化之前的架构:
要替换三个flume的file channel不仅仅是从kafka之前的三个替换,我们还要替换kafka到es的flume,让kafka中的数据直接到es,这样我们又会减少一个堵塞的点,数据的流向也会更简单明晰:
配置文件
balance.sources =