Hadoop入门指南之表连接操作
在分析大数据时,有时需要处理多个表,表与表之间通过主键和外键关联。在分析的时候就需要把多个表关联起来,在sql中通常是使用join连接查询,在hadoop中也可以实现join操作来完成需求。假设现在有两个数据文件,分别为students.txt和score.txt:s001,张三,男s002,小梅,女c001,s001,语文,92c002,s001,数学,88c003,s001,英语,90c004,s002,语文,95c005,s002,数学,92c006,s002,英语,91
复制链接