1 实验内容
单机模式. 单机模式是Hadoop的默认模。当配置文件为空时,Hadoop完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。
2 实验步骤
- 添加用户和用户组
- 安装相关的配置包
- 配置ssh免密码登录
- 下载并安装Hadoop
- 测试单机模式
3 安装过程
3.1 添加用户和用户组
首先添加Hadoop用户和用户组,用户和用户组运行Hadoop
$sudo adduesr hadoop //添加用户组,sudo是Linux系统管理指令,是允许系统管理员让普通用户执行一些或者全部的root命令的一个工具
$sudo usermod -G sudo hadoop //添加hadoop的sudo权限
3.2 安装相关的配置包
$sudo apt-get update //更新源,apt-get是APT包管理工具
$sudo apt-get install openssh-server rsync //安装ssh服务,rsync是Linux系统下的数据镜像备份工具
$sudo service ssh restart //重启ssh服务
$sudo apt-get install openjdk-7-jdk //安装jdk
$ java -version //查看java版本
3.3 配置ssh免密码登录
$su -l hadoop //切换到Hadoop用户
$ssh-keygen -t rsa -P “” //配置ssh环境免密码登录
$cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys //加入授权
$ssh localhost //验证登录本机是否还需要密码
3.4 下载并安装Hadoop
$wget http://labfile.oss.aliyuncs.com/hadoop-2.6.0.tar.gz //下载Hadoop
$tar zxvf hadoop-2.6.0.tar.gz //解压Hadoop安装包
$sudo mv hadoop-2.6.0 /usr/local/hadoop //将hadoop-2.6.0移到/usr/local/hadoop 目录下
$sudo chmod 774 /usr/local/hadoop //权限设置,可读可写可执行
配置Hadoop
$vim /home/hadoop/.bashrc //添加内容
在/home/hadoop/.bashrc文件末尾添加下列内容:
#HADOOP START
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP END
保存退出后,激活新加的环境变量,export将变量输出为环境变量
$source ~/.bashrc //激活环境变量
3.5 测试单机模式
创建输入的数据,暂时采用/etc/protocols文件作为测试
$cd /usr/local/hadoop //进入到/usr/local/hadoop
$sudo mkdir input //建立一个文件
$sudo cp /etc/protocols ./input //复制文件或者目录
执行Hadoop WordCount应用(词频统计)
$bin/hadoopjarshare/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.6.0-sources.jarorg.apache.hadoop.examples.WordCount input output
查看生成的单词统计数据
$cat outsput/* //连接文件并显示内容
4 实验总结
在搭建过程中对命令中的一些单词的理解
- Cp 复制文件或目录
- Mv 移动文件或改名
- Sync 刷新文件系统缓冲区
- Apt-get APT包管理工具 Ssh Mv 移动文件或改名 Sync 刷新文件系统缓冲区 Apt-get APT包管理工具
- Ssh 安全连接客户端
- Ssh-keygen 生成、管理和转换认证钥匙
- Wget 从指定URL地址下载文件
- Zxvf:
- x :从 tar 包中把文件提取出来
- z : 表示 tar 包是被 gzip 压缩过的,所以解压时需要用 gunzip 解压
- v : 显示详细信息
- f xxx.tar.gz : 指定被处理的文件是 xxx.tar.gzf