一次Spark程序运行缓慢原因排查

功能:判断车辆轨迹数据在指定区域内停留时间超过半小时。

实现思路:车辆定位数据生成RDD,遍历RDD每个元素,判断是否在指定区域内,如果在,则累加计算停留时间,最后判断停留时间是否超过半小时。

代码

sortLocationInfoRDD.foreachPartition(
                    new VoidFunction<Iterator<CarLocationInfo>>() {
                        @Override
                        public void call(Iterator<CarLocationInfo> iterator) throws Exception {
                            Jedis jedis = JedisUtil.getInstance().getJedis(Constants.REDIS_IP, Constants.REDIS_PORT);
                            while (iterator.hasNext()) {
                                CarLocationInfo locationInfo = iterator.next();
                                System.out.println("开始:"+System.currentTimeMillis());
                                //判断定位点是否在指定区域内,然后使用Redis记录停留状态和累计停留时间
                                System.out.println("结束:"+System.currentTimeMillis());
                            }

                            JedisUtil.getInstance().closeJedis(jedis, Constants.REDIS_IP, Constants.REDIS_PORT);

                        }
                    }
            );

问题:采用yarn-client方式运行,查看log发现开始时间和结束时间花费时间达数秒,而使用java程序单独运行区域判别程序,速度很快。也就是出现spark yarn模式运行速度还不如单台电脑。

排查过程

1.首先是网上查了一下Spark程序运行缓慢、Spark性能调优的方法,更多是一些参数配置性的操作,然并卵。

2.查看spark job,发现程序卡在foreachPartitions。

foreachPartitions中有两部分代码,一部分是判别定位点是否在指定区域内,另一部分是对Redis的操作。

注释掉Redis操作部分代码,执行程序,发现运行速度是正常的,所有最终定位到时对Redis的操作造成了程序运行缓慢,由于所有操作都针对Redis上的一个key-value,所以怀疑是Redis并发操作造成阻塞。

经验证,确实是Redis的并发操作造成阻塞。

如下代码,竟然几分钟都执行不完。

Jedis jedis = new Jedis(Constants.REDIS_IP, Constants.REDIS_PORT);
        System.out.println(System.currentTimeMillis());
        for (int j=0; j<100; j++) {
            for (int i=0; i<7000;i++) {
                jedis.set("key1", "value1");
                jedis.get("key1");
            }
        }
        System.out.println(System.currentTimeMillis());

解决办法

在foreachPartition下使用内存变量来记录状态,可以达到使用Redis同样的目的。

总结

注意检查Redis的操作,比如是否关闭Redis连接等,是否存在并发操作Redis的一个值。

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值