本地运行hadoop以及远程提交任务到集群环境配置

工具准备

我这里配置的是2.5.2的版本,根据自己的情况选择想要配置的版本。需要准本工具如下,hadoop.dll和winutils.exe要下载对应的版本。(我是在win10下操作的)
在这里插入图片描述

一、 hadoop的解压

1、 找一个你想解压的位置解压hadoop-2.5.2.tar.gz到本地并把winutils.exe放到hadoop的bin下,下面是我的解压位置:
在这里插入图片描述
2、 把hadoop.dll放到C:\Windows\System32,如下位置所示
在这里插入图片描述
3、 配置hadoop的环境变量

在这里插入图片描述
在path中加入
在这里插入图片描述
修改windows中的hosts文件,路径为C:\Windows\System32\drivers\etc
在这里插入图片描述

修改如下:
在这里插入图片描述
在这里插入图片描述
本地环境搭建完成

二、测试

打包可以通过maven的package直接打包
在这里插入图片描述
我用的是sqoop的导入来测试的远程提交,你可以写一个简单的词频统计来测试,其中的ip为集群中主节点是IP地址,测试代码如下:

package cn.edu.zut;

import org.apache.hadoop.conf.Configuration;
import org.apache.sqoop.Sqoop;
import org.apache.sqoop.tool.SqoopTool;
import org.apache.sqoop.util.OptionsFileUtil;


public class MysqlToHDFS {
   

    private static int importMysqlToHDFS() throws Exception {
   
        String[] args = new String[]{
   
               "--connect","jdbc:mysql://ip:3306/ct180808", //url
                "--driver", "com.mysql.jdbc.Driver",  //驱动,默认为mysql驱动
                "--username","root",  //数据库用户名
                "--password","123456",  //数据库用户密码
                "--table","ct_user",  //指定表名
                "--columns","tel,name",  //指定列,若是全表导入,需要把此参数去掉
                "--target-dir&#
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值