Erlang里实现MapReduce


http://www.cnblogs.com/orez88/articles/1787119.html


参考: http://weblambdazero.blogspot.com/2008/08/mapreduce-in-erlang.html 

MapReduce的主要原理是将一个数据集上的计算分发到许多单独的进程上(map),然后收集它们的结果(reduce)。 

在Erlang里实现MapReduce非常细节也十分简单,例如Erlang的作者Joe Armstrong发表了一段代码来表示MapReduce版本的Erlang标准lists:map/2方法: 
pmap.erl 
Java代码 
  1. -module(pmap).  
  2. -export([pmap/2]).  
  3.   
  4. pmap(F, L) ->   
  5.   S = self(),  
  6.   Pids = lists:map(fun(I) ->   
  7.     spawn(fun() -> do_fun(S, F, I) end)  
  8.   end, L),  
  9.   gather(Pids).  
  10.   
  11. gather([H|T]) ->  
  12.   receive  
  13.     {H, Result} -> [Result|gather(T)]  
  14.   end;  
  15. gather([]) ->  
  16.   [].  
  17.   
  18. do_fun(Parent, F, I) ->                        
  19.     Parent ! {self(), (catch F(I))}.  

pmap的原理也很简单,对List的每项元素的Fun调用都spawn一个process来实际处理,然后再调用gather来收集结果。 

如此简洁的代码就实现了基本的MapReduce,不得不服Erlang! 

下面是一个fib的示例调用: 
fib.erl 
Java代码 
  1. -module(fib).  
  2. -export([fib/1]).  
  3.   
  4. fib(0) -> 0;  
  5. fib(1) -> 1;  
  6. fib(N) when N > 1 -> fib(N-1) + fib(N-2).  


编译好之后比较一下lists:map/2和pmap:pmap/2的执行效率: 
Java代码 
  1. Eshell > L = lists:seq(0,35).  
  2. Eshell > lists:map(fun(X) -> fib:fib(X) end, L).  
  3. Eshell > pmap:pmap(fun(X) -> fib:fib(X) end, L).  

测试结果lists:map执行时间大概4s,pmap:pmap执行时间大概2s,节约了一半的时间,呵呵。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值