Exception in thread “main“ org.apache.spark.SparkException: Task not serializable异常

Exception in thread "main" org.apache.spark.SparkException: Task not serializable异常

环境

Java1.8 、 Maven3.X、Spark3.X

问题代码

逆序获取三个数字

    rdd = sc.parallelize(Stream.of(3, 2, 5, 0).collect(Collectors.toList()));
    // takeOrOrdered
    List<Integer> list = rdd.takeOrdered(3,(a,b)->-Integer.compareInt(a,b));

启动后报错Exception in thread "main" org.apache.spark.SparkException: Task not serializable异常

错误排查

首先细细想一下Spark在进行RDD操作的时候会涉及分布式,那么自然会设计网络IO,而网络IO会通过字节传输。

想到这里就应该想到Comparator没有实现Serializable接口导致序列化失败。

错误修正

直接进行自定义一个可以序列化的比较器。完整代码如下:

public class RddActionTest01 {
    public static void main(String[] args) {
        try (JavaSparkContext sc = ContextFactory.create("local")) {
            JavaRDD<Integer> rdd = sc.parallelize(Stream.of(3, 2, 5, 0).collect(Collectors.toList()));
            // takeOrOrdered
            List<Integer> list = rdd.takeOrdered(3,new MyComparator());

            System.out.println(list);
        }
    }
    static class MyComparator implements Serializable,Comparator<Integer> {
        @Override
        public int compare(Integer o1, Integer o2) {
            return -Integer.compare(o1,o2);
        }
    }

再次运行,问题解决

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值