Ubuntu14上安装配置Hadoop2.6.0

Hadoop是使用java编写的,所以在进行Hadoop开发之前,需要安装配置java环境: 

JAVA安装和配置

jdk下载地址(我下载的是jdk1.8.0_92):

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html


使用一下命令解压:

sudo -xvf jdk1.8.0_92.tar.gz


我将解压之后的文件(jdk1.8.0_92)拷贝到 /opt/java目录下面,将 /opt/java/jdk1.8.0_92作为JAVA_HOME:

export JAVA_HOME=/opt/java/jdk1.8.0_92
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH 
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

设置java环境变量也可以如下:

sudo gedit /etc/profile


在打开的文件中将下面的拷贝进去,并保存:

#java Home
export JAVA_HOME=/opt/java/jdk1.8.0_92
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=${JAVA_HOME}/lib:${JRE_HOME}/jre:${CLASSPATH}
export PATH=${JAVA_HOME}/bin:${PATH} 


输入以下命令使得配置生效:

sudo source /etc/profile

经过以上的配置java的环境变量就配置好了,可以使用以下的命令检测:



HADOOP的安装配置

首先,需要下载hadoop2.6.0(华中科技大学的镜像下载地址):

http://mirrors.hust.edu.cn/apache/hadoop/common/


解压下载好的hadoop-2.6.0.tar.gz文件:

sudo tar -xvf hadoop-2.6.0.tar.gz

解压之后,将文件夹改名为hadoop(个人喜好),之后移动到/usr/local目录下:

sudo mv hadoop /usr/local

之后就是配置hadoop的开发环境了:

因为我们的ubuntu中可能安装了不止一个版本的jdk,所以首先需要设置首选的jdk,就像windows中设置默认打开的软件一样:

update-alternatives --config java

[注意] 执行上面的命令为了查看电脑中的jdk路径,有可能报下面的错误:

update-alternatives: 错误: 无 java 的候选项

解决方法:

(使用/opt/java/jdk1.8.0_92/bin/java来提供/usr/bin/java,需要注意的是,/opt/java/jdk1.8.0_92处是之前保存jdk的路径)

update-alternatives  --install  /usr/bin/java java /opt/java/jdk1.8.0_92/bin/java

这样再次运行 update-alternatives --config java就不会报错了。


编辑/.bashrc文件:

 sudo gedit ~/.bashrc

打开/.bashrc文件之后,粘贴下面的代码:

#HADOOP VARIABLES START
export JAVA_HOME=/opt/java/jdk1.8.0_92
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP VARIABLES END

[注意] JAVA_HOME和HADOOP_INSTALL需要根据自己java_home以及hadoop的安装路径进行配置。


执行下面的命令,更新/.bashrc的信息:

 sudo source ~/.bashrc

还需要配置一项很重要的地方:编辑/usr/local/hadoop/etc/hadoop/hadoop-env.sh

sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh

找到JAVA_HOME,并改写为自己配置的JAVA_HOME:



为了方便开发,我们可以讲/usr/local/hadoop的读写权限修改一下:

sudo chmod 774 /usr/local/hadoop


WordCount测试:


如上图,在/usr/local/hadoop下新建两个文件夹,input用于存放目标文件,output用于输出结果:

sudo mkdir input
sudo mkdir output

并在input目录下放置一个num.txt文件,程序开始之后,去统计num.txt文件中各个单词出现的数量:



使用下面的命令开始WordCount程序:

// 在/usr/local/hadoop路径下执行
bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.6.0-sources.jar org.apache.hadoop.examples.WordCount input output/result

[注意]因为我使用的是hadoop-2.6.0,故而上面是hadoop-mapreduce-examples-2.6.0-sources.jar,此处需要注意一定要和你的hadoop版本号一致!!!


如果有下面的输出,说明Hadoop已经安装配置好了,并已经统计出了结果:


.................输出太长,只截取头部和尾部的输出内容.............


此时,在/usr/local/hadoop/output目录下可以看到下面的文件:

会生成result文件夹,其中part-r-00000就是统计的结果:


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是Hadoop安装教程-单机-伪分布式配置-Hadoop2.6.0-Ubuntu14.04详细教程教学: 1. 安装Java Hadoop是基于Java开发的,因此需要先安装Java。可以在终端中输入以下命令进行安装: ```bash sudo apt-get update sudo apt-get install default-jdk ``` 2. 下载Hadoop 可以在Hadoop官网下载Hadoop压缩包,也可以在终端中输入以下命令进行下载: ```bash wget https://archive.apache.org/dist/hadoop/core/hadoop-2.6.0/hadoop-2.6.0.tar.gz ``` 3. 解压Hadoop 在终端中输入以下命令解压Hadoop压缩包: ```bash tar -xzvf hadoop-2.6.0.tar.gz ``` 4. 配置Hadoop环境变量 打开终端中的/etc/environment文件,并在其中添加以下内容: ```bash export HADOOP_HOME=/path/to/hadoop export PATH=$PATH:$HADOOP_HOME/bin ``` 其中,/path/to/hadoopHadoop所在的路径。保存文件后,输入以下命令使配置生效: ```bash source /etc/environment ``` 5. 配置Hadoop 进入Hadoop目录,编辑etc/hadoop/hadoop-env.sh文件。找到以下行: ```bash export JAVA_HOME=${JAVA_HOME} ``` 将其修改为: ```bash export JAVA_HOME=/usr/lib/jvm/default-java ``` 保存文件并关闭。 6. 配置HDFS 进入etc/hadoop目录,编辑hdfs-site.xml文件。添加以下内容: ```xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/path/to/hadoop/data/dfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/path/to/hadoop/data/dfs/datanode</value> </property> </configuration> ``` 其中,/path/to/hadoop/data为Hadoop数据存储路径。 7. 配置YARN 进入etc/hadoop目录,编辑yarn-site.xml文件。添加以下内容: ```xml <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> </configuration> ``` 8. 配置MapReduce 进入etc/hadoop目录,编辑mapred-site.xml文件。添加以下内容: ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` 9. 格式化HDFS 在终端中输入以下命令格式化HDFS: ```bash hdfs namenode -format ``` 10. 启动Hadoop 在终端中输入以下命令启动Hadoop: ```bash start-all.sh ``` 11. 验证Hadoop 在浏览器中输入http://localhost:50070,即可访问Hadoop Web UI。在该页面中可以查看HDFS的状态、数据块、节点等信息。 以上就是Hadoop安装教程-单机-伪分布式配置-Hadoop2.6.0-Ubuntu14.04详细教程教学。希望对你有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值