Hadoop分布式文件系统利用 java API 实现

本文档详细介绍了如何在Linux系统上配置Hadoop,包括环境变量设置、jar包管理、Eclipse集成、配置检查以及Windows环境下Hadoop工具包的安装。通过这些步骤,你可以使用Java API与Hadoop进行交互。
摘要由CSDN通过智能技术生成

(前提:自己的linux系统中的集群已搭建完毕 )

1 . 首先在电脑中安装 hadoop

    配置环境变量:

    右键点击“计算机”--> 属性 --> 高级系统设置 --> 环境变量

    创建一个 “HADOOP_HOME”,值为hadoop安装包的路径

        

    在“Path”的变量值的最前面,追加{ hadoop-2.7.6\bin } 的路径。(如果没有Path,创建一个Path,添加以下内容)

Path=%HADOOP_HOME%\bin;

2 . 查找 hadoop 所需要的jar包

     在 { hadoop\share } 目录下 ,搜索 <.jar>, 复制后拷贝至{ hadoop-2.7.6 }/_ jar 文件夹备用

     在{hadoop_home}/_jar/目录下查找<sources>文件,剪切后拷贝至{hadoop-2.7.6}/_sources/ 备用

     在{hadoop_home}/_sources/目录下查找<test>文件,剪切后拷贝至{hadoop-2.7.6}/_test/   备用

    ( _jar : jar包  、   _source : 源码包  、  _test : 测试包 

3 . 集成eclipse环境

    上网下载 hadoop-eclipse-plugin 的jar包,将此jar包拷贝至{ eclipse_home }/plugin 下。

    (eclipse_home 为eclipse所安装的路径)

4 . 重启eclipse

5 . 校验安装是否成功

    查看windows-->perferences  是否出现 Hadoop Map/Reduce

        

6 . 在【hadoop Mapreduce】视图下,添加hadoop的安装路径

        

7 . 创建hadoop的链接

    a>.打开【MapReduce Locations】视图-->右键【新建hadoop Location...】-->弹出编辑窗口

    b>.dfs RPC 协议端口号为:9000       【注:默认为8020】

          mapreduce RPC协议端口号为:9001 【注:默认为8021】

          user name:XXXX     【注:集群名字】

          host     :主节点的 IP


8 . 配置windows Hadoop工具包

    上网下载 hadoop.dll和winutils.exe 两个文件,并将其拷贝至{hadoop-2.7.6}\bin;


恭喜你。配置成功~

    



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值