大数据下的日志-flume(二)高并发下的优化

本文介绍了在大数据环境下,Flume在高并发时遇到的问题,如内存Channel的数据丢失和单点性能瓶颈。提出了优化方案,包括调整Channel参数、采用File Channel代替Memory Channel以及设置Flume的负载均衡。详细步骤包括参数调优、配置多Agent进行负载分担,并提供了实际操作示例。
摘要由CSDN通过智能技术生成

起因

上篇博客中,我们提到了对flume的使用,但是,只是简单的使用,在高并发的情况下就会有问题,我们举两个例子:

1,在高并发下,Channel使用memory,如果使用默认配置,那么就会较快的情况下,塞满内存,造成大部分数据丢失,对的,你没有听错,memory类型的通道,是会丢失数据的,因为单纯的内存,虽然速度很快,但是当速度无法阻挡数据增长时,有些数据无法缓存,或者将内存型的缓存撑爆,我们就必须要考虑,如何优化这种结构。

2,在高并发下,flume的单点承受能力是有限的,如果没有对应的分流措施,我们依然会丧失数据,数据是宝贵的,我们的每份数据都应严肃对待。

优化

为了解决以上问题,我们提供一种参考方案:

优化结构图示:


步骤:

1,改善Channel

1.1 参数调优

将flume中memory的参数进行调整,主要优化两个参数:


a1.channels.c1.capacity = 1000000
a1.channels.c1.transactionCapacity = 10000

第一个为最大缓存的量,第二个为每次最大交易的量


评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值