前言
在mysql中,经常涉及到2张表或者多张表的关联查询,通常通过中间字段将两个表做关联,在MapReduce中,某些场景下也会遇到类似的需求,比如说,将两个原始的日志文件,通过中间业务字段进行关联,然后重新输出为一个新的文件
如下图所示,左边可理解为一张订单表,右边可理解为与之对应的商品表,相信大家一眼就能明白
现在提出需求,将这两个文件的数据,通过MapReduce输出得到下面这个格式的文件,该怎么做呢?
如果在mysql中,只需要将订单表和产品表通过产品ID做一下关联就可以得出结果,通过MapReduce该如何实现呢?
实现思路
由于整个MapReduce的过程仍然是存在的,其实只需要想明白,要实