1. 拉取镜像
docker pull sequenceiq/hadoop-docker
2. 运行镜像
docker run -it -p 50070:50070 sequenceiq/hadoop-docker:2.7.0 /etc/bootstrap.sh -bash
在镜像中运行如下命令。
开放50070是为了从web端查看hadoop运行状况。
3. build项目 (WordCount)
新建工作目录取名为 test, 进入test目录后运行如下命令:
3.1 编写程序
vim WordCount.java
hadoop中的HelloWorld程序。
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
im