学校开设了Hadoop这门课程,第一次上课就是在本机上安装一个伪分布式的Hadoop。班上大多数同学由于之前没有使用过linux系统(安装hadoop他们也是在虚拟机中进行)在安装的过程中出现了各种各样的问题不知道怎么解决。索性我也闲着无聊,就编写了一个一键安装伪分布式Hadoop的shell脚本让同学们使用,让同学在自己的linux系统上运行此脚本即完成安装。
准备资源:
- jdk1.7 虽然linux自带了openjdk,但个人还是习惯使用oracle的
- hadoop2.7.tar.gz 在Apache上下载
- 两个包准备好之后,mkdir all 创建一个all的空文件夹,然后把上面两个tar.gz包仍进去。执行 tar -zcvf all.tar.gz all 把all文件夹压缩成all.tar.gz
编写执行安装hadoop过程的一个shell
install_hadoop.
#!/bin/bash
size=0
#最终生成的文件名为install_hadoop.bin而我们的all.tar.gz被>>到该文件后面
tail -c $size install_hadoop.bin >all.tar.gz
tar -zxf all.tar.gz
cd all
echo "正在安装.请稍等..."
mkdir /usr/local/hadoop
mkdir /usr/local/JDK
tar -zxf hadoop-2.7.0.tar.gz -C /usr/local/hadoop
tar -zxf jdk-7u79-linux-x64.tar.gz -C /usr/local/JDK
#设置环境变量
echo export JAVA_HOME=/usr/local/JDK/jdk1.7.0_79 >>/etc/profile
echo export HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.0 >> /etc/profile
echo export PATH=$PATH:/usr/local/hadoop/hadoop-2.7.0/bin:/usr/local/hadoop/hadoop-2.7.0/sbin:/usr/local/JDK/jdk1