【Hadoop】矩阵相乘MapReduce实现

Method 1

A:M*K

B: k*N

Input

A : M行 sequenceFIle <Int,Array(k)>

B: N 行 sequenceFIle <Int,Array(k)>

 

Map:

If read line from A

For j = 1->N

    Collect(<(linenum,j), vector(k)>)

If read line from B

For I = 1->M

Collect(<(i,linenum)>,vector(k)>)

 

 

Reduce:

While(iterator.hasNext())

    Vi = iterator.next()

Result = v1*v2

Output(<I,j>,result);

 

优点:逻辑简单,直接

缺点数据打散,还需要一次mapreduce还原成矩阵。

对Map 修改可以分块进行 可以大大减少空间占用

原来相当于分块数 F = M or N    空间复杂度 为 (N*M+M*N)*K =O(2 M*N *K)

如果指定分块个数 F 为常数  空间复杂度 为 O ((M+N)*K)

 只要F <= 0.5*(M+N)

 

Method2

A:M*K

B: k*N

 

同时读入

Input

A : K行 sequenceFIle <Int,Array(M) m>

B: K 行 sequenceFIle <Int,Array(N) n>

 

Map

For i = 1->M:

For j = 1 ->N:

n[j]= m[i]*n[j]

collect(<i, Array(N) n)>

 

 

Reduce

SumVector[N]

While(iterator.hasNext())

for j= 1->N

     SumVector[j] += iterator.next()[j]

 

collect(<i,SumVector[N]>)

 

output : M*N matrix

 

优点直接生成矩阵

缺点需要同时读入两个数据,map不好实现,也需要先通过一个mapreduce merge

转载于:https://www.cnblogs.com/iDonal/archive/2012/08/09/2630517.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值