Kettle5.4统计各部门工资总额

实验环境及配置


  • 版本:hadoop-2.7.3
  • 模式:伪分布式
  • 网络模式:NAT
  • 虚拟机ip:192.168.215.135(读者根据自己得实际情况修改)
  • 虚拟机主机名称:hadoop001
  • 虚拟机内存:4G
  • kettle版本5.4(由于虚拟机内存有限,尽量使用低版本的)
  • kettle环境安装及配置(参考之前的博客)

一、任务说明


  • 利用Kettle设计实现求出各个部分员工工资总和。
  • 测试数据:员工信息表

二、设计转换和作业


  1. 设计mapper的转换
    在这里插入图片描述

  2. 设计reducer转换
    在这里插入图片描述

  3. 设计Job作业
    在这里插入图片描述

三、配置转换和作业


  1. 配置mapper转换

    1. 上图所示中的 "Input"指的是左边菜单栏中Big Data菜单下的MapReduce Input 组件,双击进行编辑:
      在这里插入图片描述

    2. 上图所示中的"拆分字段" 指的是左边菜单栏中“转换”菜单下的“拆分字段”组件,双击进行编辑:注意: 其中的"字段名称":可以任意取名的,按照如图进行配置
      在这里插入图片描述

    3. 上图所示中的"利用Janino计算Java表达式" 指的是左边菜单栏中"脚本"菜单下的“利用Janino计算Java表达式” 组件,双击进行编辑:
      在这里插入图片描述

    4. 配置“利用Janino计算Java表达式",如下所示:
      在这里插入图片描述

    5. 上图所示中的
      在这里插入图片描述

  2. 配置reducer转换

    1. 根据设计图,图中的 "Input"指的是左边菜单栏中Big Data菜单下的MapReduce Input 组件,双击进行编辑:
      在这里插入图片描述

    2. 上图所示中的"在内存进行分组" 指的是左边菜单栏中"统计"菜单下的“在内存进行分组” 组件,双击进行编辑:
      在这里插入图片描述

    3. 上图所示中的"ouput" 指的是左边菜单栏中Big Data菜单下的MapReduce Output 组件,双击进行编辑:
      在这里插入图片描述

  3. 配置Job作业

    1. 上图所示中的"START" 指的是左边菜单栏中"通用"菜单下的START组件,如下所示:
      在这里插入图片描述
    2. 上图所示中的"Pentaho MapReduce" 指的是左边菜单栏中Big Data菜单下的Pentaho MapReduce组件,双击进行编辑:
      1. 【A】配置Hadoop Cluster:
        在这里插入图片描述
        特别注意: 如下配置,如果在Windows上(C:\Windows\System32\drivers\etc\hosts)配置了虚拟机主机名称和虚拟机的IP映射关系,则如下配置写IP地址或者主机名称都可以
        在这里插入图片描述

      2. 【B】配置Mapper,把之前新建的mapper的转换放进来
        在这里插入图片描述

      3. 【C】配置reducer,把之前新建的reducer的转换放进来
        在这里插入图片描述

      4. 【D】配置Job Setup
        在这里插入图片描述
        在这里插入图片描述

      5. 【E】配置Cluster,选择自己新建的Hadoop Cluster即可
        在这里插入图片描述

四、运行转换和作业


  1. 前提: 运行前,务必确保hadoop集群已经启动,并且HDFS上input目录下有文件,我的文件是testData.txt,文件内容就是前文所述的【测试数据】
  2. 选择job任务,切换到job视图后,点击kettle工作区顶部的启动按钮,在弹窗中,点击执行按钮
  3. 运行
    在这里插入图片描述

五、查看结果


  1. 在kettle控制台查看结果:
    在这里插入图片描述
    在这里插入图片描述

  2. 在Hadoop上查看结果,即查看Yarn容器上是否接收到该任务:
    在这里插入图片描述
    等待执行结束!

  3. 成功后的查看结果: 如成功,则可以查看下HDFS上的结果:
    执行: hdfs dfs -cat /user/root/mr/emp/part-00000
    在这里插入图片描述
    如不成功,请查看报错日志,解决错误后,请在继续上述步骤
    我的成功了,可以喝杯咖啡去咯祝大家好运!!!!!

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

若兰幽竹

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值