Storm 的流量控制和多线程并发处理

  • 面临问题

storm多线程的时候,会遇到并发修改的问题,会报concurrentModificationException,如下图所示
这里写图片描述

  • 解决方法
    • 第一种治标不治本的方法:

一方面,对发送到kafka的数据进行控制,将线程sleep的时间变长

if(count==18000)
            {
                try {
                    Thread.sleep(1000);
                    time++;
                } catch (InterruptedException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
                count=0;
            }

另一方面,可以从处理的线程入手,即不允许并发修改(单线程不会报这种错误);
可以将线程数设低,控制比较快的处理,即前一部分的数据处理过快,导致后面数据处理成为瓶颈,也就是要找到一个平衡点。

  • 第二种网络上的其他人写的方法(试过,都不管用):
    1.hasNext()是不会抛出ConcurrentModificationException的,将next()换成hasNext(),但是还是会用到next()对ArrayList进行遍历
    2.使用并发容器CopyOnWriteArrayList代替ArrayList
    下面是原先代码。
public static void modify(ArrayList<frequent> afr, double count,String time, PatternTree tree) 
{
    for (frequent fr : afr) 
        {
            ArrayList<String> item = fr.getItem();
            double value = fr.getCount();
        }
}

做了如下修改

public static void modify(List<frequent> afr, double count,String time, PatternTree tree)
 {
    for(Iterator it = afr.iterator(); it.hasNext();) 
        {
            List<String> item=new CopyOnWriteArrayList<String>();
            item = ((frequent) it.next()).getItem();
            double value = ((frequent) it.next()).getCount();
        }
 }

最终还是报这个错,不管是修改遍历方法,还是换成CopyOnWriteArrayList,当一个线程执行modify方法的时候,另一个线程修改了modify中的afr,就会抛出ConcurrentModificationException。

  • 最终方案
    将ConcurrentModificationException的异常catch住,这样导致了发送数据会fail掉,storm有出错重发的机制,所以会不断重发,拖慢了处理速度,在后面的博客中,我会介绍storm的Qos的方法,减少fail的数据,加快处理的速度。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值