scala 与 spark 并行化

bai_Mou

于 2021-07-30 09:11:33 发布

阅读量267

点赞数

原文链接：https://blog.csdn.net/lanchunhui/article/details/86707477

版权

1. `.par`普通集合转换为并行集合

scala.collection:

scala> (1 to 5).foreach(println(_))
12345

scala> (1 to 5).par.foreach(println(_))
13254

注意既然是并行化处理，即一个集合不同的元素由不同的线程操作，不同线程执行的顺序是无法保证的；
获取线程名：

scala> (0 to 10000).collect { case _ => Thread.currentThread.getName}.distinct
scala.collection.immutable.IndexedSeq[String] = Vector(main)

scala> (0 to 10000).par.collect { case _ => Thread.currentThread.getName}.distinct
scala.collection.parallel.immutable.ParSeq[String] = ParVector(ForkJoinPool-1-worker-15, ForkJoinPool-1-worker-19, ForkJoinPool-1-worker-23, ForkJoinPool-1-worker-3, ForkJoinPool-1-worker-17, ForkJoinPool-1-worker-21
...

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

bai_Mou

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scala 与 spark 并行化

1..par普通集合转换为并行集合scala.collection:scala> (1 to 5).foreach(println(_))12345scala> (1 to 5).par.foreach(println(_))13254 注意既然是并行化处理，即一个集合不同的元素由不同的线程操作，不同线程执行的顺序是无法保证的；获取线程名： scala> (0 to 10000).collect { case _ => Thread.
复制链接

扫一扫