转自:http://blog.sina.com.cn/s/blog_675e4f240102uwim.html
一、在Ubuntu下创建hadoop组和hadoop用户
Ubuntu版本:ubuntu-14.04-desktop-amd64+mac(32位的配置方法类似)
Hadoop版本:hadoop-2.4.0
增加hadoop用户组,同时在该组里增加用户hadoopusr1,后续在涉及到hadoop操作时,我们使用该用户。
1、创建hadoop用户组
2、创建hadoop用户
3、为hadoop用户添加权限
修改如下:
二、用新增加的hadoop用户登录Ubuntu系统
三、安装ssh
确认已经连上互联网,输入命令(在线安装),如需密码输入即可,遇到yes/no输入yes即可:
sudo apt-get install openssh-server
注:若没联网,可手动下载openssh-client和openssh-server及其相关依赖软件包,下载完拷贝到Linux环境下,按照命令依次安装。本版本Linux自带openssh-client,无需再安装(除非升级需要),只需根据需要安装openssh-server及其相关依赖包,列举如下(32位为例):
libck-connector0_0.4.5-3.1ubuntu2_i386.deb
openssh-sftp-server_6.6p1-2ubuntu1_i386.deb
openssh-server_6.6p1-2ubuntu1_i386.deb
安装.deb命令如下:
此外,要注意openssh-client和openssh-server的版本型号要对应,如不对应会出现安装失败,可重新更换为对应型号软件包再安装即可。
安装完成后,启动服务
sudo /etc/init.d/ssh start
查看服务是否正确启动:ps -e | grep ssh
设置免密码登录,生成私钥和公钥
ssh-keygen -t rsa -P ""
此时会在/home/hadoopusr1/.ssh下生成两个文件:id_rsa和id_rsa.pub,前者为私钥,后者为公钥。
下面我们将公钥追加到授权的key(authorized_keys)中,它为用户保存所有允许以当前用户身份登录到ssh客户端用户的公钥内容。
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
登录ssh
ssh localhost
退出
exit
四、安装Java环境
确认已经连上互联网,输入命令(在线安装),如需密码输入即可,遇到yes/no输入yes即可:
sudo apt-get install openjdk-7-jdk
可以先将jdk-8u5-linux-x64.tar.gz右键“ExtractHere“,然后移动到usr/lib/jvm/
若用命令,如下:
先在usr/lib下建立一个专用的java工作区,如命名为jvm:
cd到jdk-8u5-linux-x64.tar.gz所在文件夹,就地解压:
将解压后的文件夹jdk1.8.0_05移到指定的java工作区:
接下来,配置环境变量:
#set
五、安装hadoop2.4.0
1、官网下载http://mirror.bit.edu.cn/apache/hadoop/common/
2、安装
(注:期间若出现文件权限不足导致某些文件(夹)不能访问时,可使用
来解除权限控制。Ubuntu
若用命令,如下:
(1)
sudo
(或sudo tar xzf hadoop-2.4.0.tar.gz)
(2) 重命名为hadoop-2.4.0为hadoop:
mv
(3)将解压后的文件夹hadoop移到指定的hadoop的权限工作区:
mv hadoop /usr/local
3、配置
配置该文件前需要知道Java的安装路径,用来设置JAVA_HOME环境变量,可以使用下面命令行查看安装路径
完整的路径为
#HADOOP
export
export
export
export
export
export
export
export
export
export
#HADOOP
最终结果如下图:
执行下面命,使添加的环境变量生效:
2)编辑/usr/local/hadoop/etc/hadoop/hadoop-env.sh
六、WordCount测试
单机模式安装完成,下面通过执行hadoop自带实例WordCount验证是否安装成功:
mkdir input
cp README.txt input
执行结果:
执行 cat output/*,查看字符统计结果
至此,单机模式安装成功!