Storm读取Mysql数据库不能加大bolt并行数写入hdfs解决方法

解决方法:建立一个中间表    

   spout发射数据给bolt,bolt进行数据清洗,然后插入到一张中间表里面,然后再写一个spout,这个spout不发射数据,每次next时去中间表查看,如果超过预计数据的条数,可以读过来批量插入到hdfs里,一直只有一个spout在写hdfs,或者不写spout,直接写个java程序,每分钟看一次数据库中间表,有数据就写入hdfs。同样,bolt每次被spout或bolt触发时,确实可以去查看中间表,但也存在一个问题,bolt批量去操作中间表插入hdfs会耗时,如果给这个bolt发射的tuple太多,在做批量这个操作时,就会累积大量发射过来的tuple,也会超出队列发生阻塞。中间表可以定时读取数据库时,将数据插入到hdfs,之后把中间表读取的数据都删掉,这样就可以保证了中间表一直就是那么多的数据。bolt自己消费队列数据的速度低于spout插入队列的速度,过一会bolt就会超时。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值