linux下配置hadoop环境
视频讲解地址
安装和卸载java(软件地址会放到文章最后)
1.卸载:
rpm -qa | grep java | xargs sudo rpm -e --nodeps
2.软件压缩包一般放在/opt/software目录下。软件放在/opt/module目录下
3.配置环境变量:/etc/profile文件
#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.7.0_80
export PATH=$PATH:$JAVA_HOME/bin
#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.6.5
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
注意:
配置好之后要执行文件,让它生效:
source /etc/profile
4.解压的指令:
tar -zxvf jdk-7u80-linux-x64.tar.gz -C /opt/module/
tar -zxvf hadoop-2.6.5.tar.gz -C /opt/module/
5.文件上传到远程服务器上:
- 真实情况下,我们是接触不到服务器的,需要用shell或者ftp上传。
6.配置Hadoop
打开:/etc/hadoop/hadoop-env.sh
修改下面这一行
# set to the root of your Java installation
export JAVA_HOME=/opt/module/jdk1.7.0_80
测试样例程序:
mkdir input
cp etc/hadoop/*.xml input
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar grep input output 'dfs[a-z.]+'
cat output/*
编写程序步骤:
1.创建一个输入文件夹: input
2.放入输入文件
3.执行 bin/hadoop 下的jar程序
4.查看结果
软件的下载链接:
Hadoop2.65:https://share.weiyun.com/5spD3L9
JDK1.7:https://share.weiyun.com/59kM2iq