Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法
一、背景
- Debezium采集数据并发送到Kafka,由一个flume agent接收多个数据库的数据,其中一个数据库产生大量数据,导致flume channel数据堆积,服务器io打满,导致数据消费不及时,影响了其他数据库,导致下游任务都产生了延迟
主要产生以下影响:
- 数据堆积
du -sh *
709G flume_agent1
- io打满
iostat -x 1 10
Device %util
vdb %100
二、快速应对解决方法
- 步骤一:首先需要快速定位产生大量数据库的数据
- 步骤二:确定产生大量数据的数据库是否是正常业务需求,如果是可以考虑先创建一个新的flume agent接收这个数据库的数据,再把这个数据库从受影响的flume agent中踢出,
当上游数据库大量数据导致Flume Agent数据堆积、服务器IO满载,影响下游任务时,可通过快速定位问题源、创建新Agent、调整消费策略等方法解决。包括临时停用Agent清理数据、按需启动新Agent使用earliest策略确保数据不丢失,以及环境与资源优化策略,如环境隔离、服务器条带化和冗余备份。
订阅专栏 解锁全文
884

被折叠的 条评论
为什么被折叠?



