关闭

hadoop的两表join

标签: joinhadoop
594人阅读 评论(0) 收藏 举报
分类:

以前我们做hadoop join的时候,总是在每个数据的表头增加一个tag,然后在reduce中根据tag来区别。

        实际上,我们可以节省这种tag,只需要使用multipleInput,就可以分别处理不同的输入路径。

        而在reduce端,我们不需要读入一个key下面所有的数据,然后再做join。

        http://www.gemini5201314.net/hadoop/hadoop-%E4%B8%AD%E7%9A%84%E4%B8%A4%E8%A1%A8join.html

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:364038次
    • 积分:5947
    • 等级:
    • 排名:第4414名
    • 原创:215篇
    • 转载:12篇
    • 译文:5篇
    • 评论:57条
    最新评论