Stream的collect方法是怎么保证线程安全的

写这篇文章是因为前段时间有个同事用parallelStream处理集合的时候发现数据丢了。因为是线上问题所以和他一起看了一下。

出问题的代码大致如下:

List<Foobar> result = new ArrayList<>();
fooList.parallelStream().forEach(bar -> {
    Foobar foobar = new Foobar(bar);
    result.add(foobar);
});


最后results少了数据,得到了一个非预期的结果。

当然能写出这样的代码很不应该,很显然这是一个因为线程安全引发的问题,因为我们知道ArrayList不是一个线程安全的容器,这与parallelStream是不是线程安全无关,它本身就是一个用多线程去帮助我们处理集合的工具,底层依赖Fork/Join框架。

上面的写法就和自己用多个线程往一个ArrayList插数据一样愚蠢,没有本质上的区别。

那么,当我们在使用parallelStream的时候,我们当然可以使用一个线程安全的容器来收集结果,但Java官方文档中更建议我们去使用collect方法,即:

List<Foobar> result = fooList.parallelStream().map(bar -> new Foobar(bar)).collect(Collectors.toList());

我们来看collect这个方法,

<R, A> R collect(Collector<? super T, A, R> collector);

需要传入Collector接口的实现。Collectors类中有大量的静态方法返回这样的实现类的对象,这里我们看toList方法,

public static <T>
Collector<T, ?, List<T>> toList() {
    return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
                               (left, right) -> { left.addAll(right); return left; },
                               CH_ID);
}

Fork/Join的思想是分治,先拆分任务,再合并结果,每个任务都用单独的线程去处理。所以虽然它同样使用ArrayList,但是我们看到他会为每个线程都创建一个ArrayList对象,最后用addAll方法把它们合并起来,每个线程操作的是自己的集合对象,自然不会有线程安全问题。

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Java Stream API 是一种用于处理集合数据的高级概念,它允许我们以一种声明式的方式对数据进行操作。在多线程环境下使用 Stream API,可以提高程序的效率和性能。 Java 8 引入的 `parallelStream()` 方法可以将普通的 Stream 转换为并行 Stream,以便在多个线程上并行执行操作。 以下是一个示例代码: ```java List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10); list.parallelStream().forEach(System.out::println); ``` 在上面的示例中,`parallelStream()` 方法将 `list` 转换为并行 Stream,然后使用 `forEach()` 方法并行输出列表中的元素。 需要注意的是,在并行处理数据时,需要确保线程安全。可以使用 `synchronized` 块、`ConcurrentHashMap` 等方式来保证线程安全。 ### 回答2: Java Stream是Java 8引入的一个重要特性,它提供了一种流式处理的方式来操作集合、数组等数据源。而多线程是一种在程序中同时执行多个任务的机制。 在Java中,我们可以使用Java Stream结合多线程来提高程序的并发性能。Java Stream可以通过parallel()方法将顺序流转换为并行流,从而实现多线程的处理。并行流将原始数据分割成多个子任务,每个子任务由单独的线程处理。各个线程之间可以独立执行,提高程序的执行效率。 使用多线程处理Java Stream时,我们可以通过以下几个步骤来实现: 1. 创建一个数据源,如List或数组。 2. 将数据源转换为流,通过stream()方法实现。 3. 将流转换为并行流,通过parallel()方法实现。 4. 在流上进行各种操作,如过滤、映射、排序等。 5. 使用终结操作对流进行执行,如forEach()、collect()等。 通过将Java Stream转换为并行流,我们可以将任务分配给多个线程来同时处理,从而提高处理速度。但是需要注意的是,并行流适用于处理大规模数据,并且处理过程是无状态的。如果处理过程存在依赖关系,那么多线程可能会引入竞态条件,导致结果不准确。 综上所述,Java Stream结合多线程可以提高程序的并发性能,但需要根据实际情况进行使用和调优,避免出现竞态条件等问题。 ### 回答3: Java Stream 是 Java 8 引入的一个新特性,用于对集合进行函数式操作。它提供了丰富的函数式编程方法,例如 map、filter、reduce 等,可以实现更简洁、高效的集合操作。而多线程是指在一个程序中同时运行多个线程来提高程序的性能和效率。 在 Java 中,Stream 可以和多线程结合使用来提高程序的并发性能。由于 Stream 提供了非常丰富的操作方法,并且可以链式调用,使得操作变得非常灵活。同时,Stream 也提供了 parallel 方法可以将串行流转换为并行流,从而可以并行处理数据。 使用多线程进行并行流操作时,Java 会将一个大数据集合划分成多个小数据集合分给不同的线程去处理,最后再合并处理结果。这样可以充分利用多核处理器的优势,提高程序的计算速度和效率。 但是需要注意的是,并行流的使用要谨慎,不适合所有情况。如果数据集较小或者操作本身比较简单,使用并行流反而可能会带来额外的开销,甚至适得其反。所以,在使用并行流时需要进行合理的评估,并根据实际情况选择是否使用。 总的来说,Java Stream 结合多线程可以提高程序的并发性能。合理地使用并行流,可以充分利用多核处理器的优势,提高程序的计算效率。但是需要注意的是,并行流的使用要谨慎,需要根据具体情况进行评估和选择。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值