java 8 map reduce_Java的map和reduce

背景虽然目前处理器核心数已经发展到很大数目,但是按任务并发处理并不能完全充分的利用处理器资源,因为一般的应用程序没有那么多的并发处理任务。基于这种现状,考虑把一个任务拆分成多个单元,每个单元分别得到执行,最后合并每个单元的结果。

Fork/Join框架是JAVA7提供的一个用于并行执行任务的框架,是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架

工作窃取算法指的是某个线程从其他队列里窃取任务来执行。使用的场景是一个大任务拆分成多个小任务,为了减少线程间的竞争,把这些子任务分别放到不同的队列中,并且每个队列都有单独的线程来执行队列里的任务,线程和队列一一对应。但是会出现这样一种情况:A线程处理完了自己队列的任务,B线程的队列里还有很多任务要处理。A是一个很热情的线程,想过去帮忙,但是如果两个线程访问同一个队列,会产生竞争,所以A想了一个办法,从双端队列的尾部拿任务执行。而B线程永远是从双端队列的头部拿任务执行(任务是一个个独立的小任务),这样感觉A线程像是小偷在窃取B线程的东西一样。

工作窃取算法的优点: 利用了线程进行并行计算,减少了线程间的竞争。

工作窃取算法的缺点: 1. 如果双端队列中只有一个任务时,线程间会存在竞争。 2. 窃取算法消耗了更多的系统资源,如会创建多个线程和多个双端队列。

框架设计

Fork/Join中两个重要的类:ForkJoinTask:使用该框架,需要创建一个ForkJoin任务,它提供在任务中执行fork和join操作的机制。一般情况下,我们并不需要直接继承ForkJoinTask类,只需要继承它的子类,它的子类有两个: a、RecursiveAction:用于没有返回结果的任务。 b、RecursiveTask:用于有返回结果的任务。

ForkJoinPool:任务ForkJoinTask需要通过ForkJoinPool来执行。

package test;

import java.util.concurrent.ExecutionException;

import java.util.concurrent.ForkJoinPool;

import java.util.concurrent.Future;

import java.util.concurrent.RecursiveTask;

public class CountTask extends RecursiveTask{

private static final long serialVersionUID = 1L;

//阈值 private static final int THRESHOLD = 2;

private int start;

private int end;

public CountTask(int start, int end){

this.start = start;

this.end = end;

}

@Override

protected Integer compute(){

int sum = 0;

//判断任务是否足够小 boolean canCompute = (end - start) <= THRESHOLD;

if(canCompute){

//如果小于阈值,就进行运算 for(int i=start; i<=end; i++){

sum += i;

}

}else{

//如果大于阈值,就再进行任务拆分 int middle = (start + end)/2;

CountTask leftTask = new CountTask(start,middle);

CountTask rightTask = new CountTask(middle+1,end);

//执行子任务 leftTask.fork();

rightTask.fork();

//等待子任务执行完,并得到执行结果 int leftResult = leftTask.join();

int rightResult = rightTask.join();

//合并子任务 sum = leftResult + rightResult;

}

return sum;

}

public static void main(String[] args){

ForkJoinPool forkJoinPool = new ForkJoinPool();

CountTask task = new CountTask(1,6);

//执行一个任务 Future result = forkJoinPool.submit(task);

try{

System.out.println(result.get());

}catch (InterruptedException e){

e.printStackTrace();

}catch (ExecutionException e){

e.printStackTrace();

}

}

}

这个程序是将1+2+3+4+5+6拆分成1+2;3+4;5+6三个部分进行子程序进行计算后合并。

源码解读

leftTask.fork();

public final ForkJoinTask fork() {

Thread t;

if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread)

((ForkJoinWorkerThread)t).workQueue.push(this);

else

ForkJoinPool.common.externalPush(this);

return this;

}fork方法内部会先判断当前线程是否是ForkJoinWorkerThread的实例,如果满足条件,则将task任务push到当前线程所维护的双端队列中。

final void push(ForkJoinTask> task) {

ForkJoinTask>[] a; ForkJoinPool p;

int b = base, s = top, n;

if ((a = array) != null) { // ignore if queue removed int m = a.length - 1; // fenced write for task visibility U.putOrderedObject(a, ((m & s) << ASHIFT) + ABASE, task);

U.putOrderedInt(this, QTOP, s + 1);

if ((n = s - b) <= 1) {

if ((p = pool) != null)

p.signalWork(p.workQueues, this);

}

else if (n >= m)

growArray();

}

}在push方法中,会调用ForkJoinPool的signalWork方法唤醒或创建一个工作线程来异步执行该task任务。

public final V join() {

int s;

if ((s = doJoin() & DONE_MASK) != NORMAL)

reportException(s);

return getRawResult();

}通过doJoin方法返回的任务状态来判断,如果不是NORMAL,则抛异常:

private void reportException(int s) {

if (s == CANCELLED) throw new CancellationException();

if (s == EXCEPTIONAL) rethrow(getThrowableException());

}

来看下doJoin方法:

private int doJoin() {

int s; Thread t; ForkJoinWorkerThread wt; ForkJoinPool.WorkQueue w;

return (s = status) < 0 ? s :

((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) ?

(w = (wt = (ForkJoinWorkerThread)t).workQueue).

tryUnpush(this) && (s = doExec()) < 0 ? s :

wt.pool.awaitJoin(w, this, 0L) :

externalAwaitDone();

}先查看任务状态,如果已经完成,则直接返回任务状态;如果没有完成,则从任务队列中取出任务并执行。

Java8 map和reduce

map

final List numbers = Arrays.asList(1, 2, 3, 4);

final List doubleNumbers = numbers.stream()

.map(number -> number * 2)

.collect(Collectors.toList());

结果:[2, 4, 6, 8]

也可以搞成其他的类型,初始List是Integer,也可以变成String

final List numbers = Arrays.asList(1, 2, 3, 4);

final List numberIndex = numbers.stream()

.map(number -> "#" + number)

.collect(Collectors.toList());

结果:[#1, #2, #3, #4]

reduce不提供初始值的reduce,返回值是Optional,表示可能为空,使用orElseGet可以返回一个null时的默认值

final List numbers = Arrays.asList(1, 2, 3, 4);

final Optional sum = numbers.stream()

.reduce((a, b) -> a + b);

sum.orElseGet(() -> 0);

结果:10 这里的(a, b) -> a + b的类型其实是BinaryOperator,它接受两个类型相同的参数 当把numbers改为Arrays.asList()时,结果为0。使用初始值的reduce,因为提供了初始值,所以返回值不再是Optional

final List numbers = Arrays.asList(1, 2, 3, 4); final Integer sum = numbers.stream() .reduce(0, (a, b) -> a + b);

结果:10

可以加博主微信一起交流:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值