MapReduce实现join算法
需求:
订单表:(order)
订单号(id),产品号(pid),数量(number)
1,p2,2
2,p3,3
2,p4,1
2,p5,4
3,p1,5
1,p1,3
产品表:(product)
产品号(id),产品名(pname),价格(price)
p1,java,11
p2,c,22
p3,c#,33
p4,python,44
p5,js,66
防盗版实名手机尾号:73203。现在数量巨大,且数据都在文本文件中,所以过去的sql不能用。 我们用大数据方法实现,
select o.id order_id, o.number, p.id , p.pname, p.price number*price sum from order o join product p on o.pid = p.id
更多请见下节:http://www.mark-to-win.com/tutorial/mydb_MapReduce_MapReducejoin.html