在Windows10上利用wsl安装docker、hadoop以及运行WordCount

第一步 以管理员打开Windows PowerShell

在这里插入图片描述

第二步 安装wsl以及Ubuntu

wsl --install

wsl --install -d Ubuntu

第三步 安装Docker

官网网址
https://docs.docker.com/desktop/install/windows-install/在这里插入图片描述
可以看到,官网说了安装docker for windows前需要有wsl 2 backend

3.1 证实docker可以运行

docker run -d -p 80:80 --name myserver nginx
docker ps

在这里插入图片描述

第四步 在docker上安装hadoop

GitHub网址
https://github.com/big-data-europe/docker-hadoop
(直接搜docker hadoop 星最多的就是这个欧洲大数据)

下载该项目到宿主机后

4.1 cmd进入hadoop目录

执行docker-compose一键拉镜像启动容器

docker-compose up -d

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

第五步 选择namenode容器进入

docker exec -it namenode bash

第六步 创建hdfs文件夹

hadoop fs -mkdir -p input

hadoop fs -ls

第六步 将data.txt从windows放入namenode容器再放入hdfs文件

6.1 将data.txt、WordCount.jar从windows复制到namenode容器

先cmd进入data.txt所在目录再执行以下命令

docker cp ./data.txt namenode:/
docker cp ./WordCount.jar namenode:/

进入容器可以ls直接检查

6.2 将namenode容器里的data.txt放入hdfs的input

进入容器输入下列命令

hdfs dfs -put data.txt input

第七步 运行WordCount.jar程序

hadoop jar WordCount.jar org.apache.hadoop.examples.WordCount input output

第八步 显示运行结果

WordCount运行结束后会输出output文件夹,其中part-r-00000就是记录结果的txt文件

hdfs dfs -cat output/part-r-00000

第九步 将输出的output从hdfs拷贝到容器再从容器拷贝到windows

9.1 从hdfs上拷贝output到容器

hadoop fs -get ./output ./

9.2 从namenode容器将output拷贝到windows

cmd进入目的目录

docker cp namenode:./output ./

在这里插入图片描述

第十步 关闭所有容器

cmd下

docker-compose down

删除hdfs文件、文件夹

hadoop fs -rm -r -skipTrash ./folder_name
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值