准备工具:VMwareworkstation12 pro(提取码:
iua8)、Hadoop2.7.3、centos7
SecureCRT 以及jdk-8u121-linux-x64.tar.gz
(jdk自行去官网找相应版本)
VMware安装centos7,以及SecureCRT 连接虚拟机自行百度!!!
一下操作皆是在SecureCRT 中进行
1.关闭防火墙
firewall-cmd --state 显示防火墙状态
只要是running/not running
都运行systemctl disable firewalld 永久禁止防火墙服务。
cd /opt
2.传输JDK和HADOOP压缩包
SecureCRT 【File】→【Connect SFTP Session】开启sftp操作
put jdk-8u121-linux-x64.tar.gz
put hadoop-2.7.3.tar.gz
3.解压安装JDK、HADOOP
tar -zxvf jdk-8u121-linux-x64.tar.gz -C /opt/module
tar -zxvf hadoop-2.7.3.tar.gz -C /opt/module
4.配置JDK并生效
文件添加:
vi /etc/profile
export JAVA_HOME=/opt/module/jdk1.8.0_121
export PATH=$JAVA_HOME/bin:$PATH
Esc :wq!保存并退出。不需要配置CLASSPATH。
配置生效
source /etc/profile
运行命令javac,检验是否成功。
成功如下所示:
5.配置HADOOP并生效
文件添加:
vi /etc/profile
export HADOOP_HOME=/opt/module/hadoop-2.7.3
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
Esc :wq!保存并退出。
配置生效
source /etc/profile
运行命令hadoop,检验是否成功。
成功如下:
5.单机模式配置hadoop -env.sh
文件修改:
vi /opt/module/hadoop-2.7.3/etc/hadoop/hadoop-env.sh
修改第25行
export JAVA_HOME=/opt/module/jdk1.8.0_121
Esc :wq!保存并退出
本地模式没有HDFS和Yarn,配置JDK后MapReduce完全能够运行java程序。
6.运行Hadoop自带程序wordcount
首先转入wordcount所在路径。
cd /opt/module/hadoop-2.7.3/share/hadoop/mapreduce
运行下面代码,创建In.txt文件,作为输入文件。
touch in.txt
运行
vi in.txt
输入需要统计的内容作为被统计词频的输入文件。
(输出目录/output必须不存在,程序运行后自动创建。)
运行wordcount:
hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount in.txt output/
注意:
当前我们所在目录为mapreduce目录,in.txt文件也在这个目录中,所以该输入目录直接读取in.txt即可,output目录必须不存在,运行程序时,系统自动创建。
运行成功之后
进入/output目录,打开文件part-r-00000查看计数结果。
hadoop fs -cat output/part-r-00000
如图所示:
大功告成!!!