java mapreduce_mapreduce-简单的Java Map / Reduce帧

几年前,当我拥有一台8核计算机时,我为自己创建了一个一次性产品,但我对此并不感到十分满意。 我从来没有像我希望的那样使它简单到可以使用,而且内存密集型任务无法很好地扩展。

如果您没有真正的答案,我可以分享更多,但是它的核心是:

public class LocalMapReduce {

private int m_threads;

private Mapper m_mapper;

private Reducer m_reducer;

...

public TOutput mapReduce(Iterator inputIterator) {

ExecutorService pool = Executors.newFixedThreadPool(m_threads);

Set> futureSet = new HashSet>();

while (inputIterator.hasNext()) {

TMapInput m = inputIterator.next();

Future f = pool.submit(m_mapper.makeWorker(m));

futureSet.add(f);

Thread.sleep(10);

}

while (!futureSet.isEmpty()) {

Thread.sleep(5);

for (Iterator> fit = futureSet.iterator(); fit.hasNext();) {

Future f = fit.next();

if (f.isDone()) {

fit.remove();

TMapOutput x = f.get();

m_reducer.reduce(x);

}

}

}

return m_reducer.getResult();

}

}

编辑:根据评论,下面是没有sleep的版本。诀窍是使用CompletionService,这实际上提供了已完成Futures的阻止队列。

public class LocalMapReduce {

private int m_threads;

private Mapper m_mapper;

private Reducer m_reducer;

...

public TOutput mapReduce(Collection input) {

ExecutorService pool = Executors.newFixedThreadPool(m_threads);

CompletionService futurePool =

new ExecutorCompletionService(pool);

Set> futureSet = new HashSet>();

for (TMapInput m : input) {

futureSet.add(futurePool.submit(m_mapper.makeWorker(m)));

}

pool.shutdown();

int n = futureSet.size();

for (int i = 0; i < n; i++) {

m_reducer.reduce(futurePool.take().get());

}

return m_reducer.getResult();

}

我还将注意到,这是一个非常精简的map-reduce算法,其中包括一个同时执行reduce和merge操作的reduce工具。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值