windows电脑上通过docker配置pyspark和mongodb环境

准备工作

1、在windows电脑上安装好docker
2、在vscode上安装好docker插件、Dev containers插件
在这里插入图片描述在这里插入图片描述

3、下载一个在github上公开的容器:link

构建容器

在下载好的文件夹下打开终端,运行docker-compose up -d
在这里插入图片描述
直接运行会出现一个报错,我们发现错误来自于spark/Dockerfile文件,原因是拉取spark安装包的网址已不再维护,我们改成如下网址:
在这里插入图片描述
我暂时没有找到国内镜像这个版本的spark可用的网址,这里必须在使用梯子的情况下才能下载。这里读者可以自己找一找可用的网址。

容器的使用

构建好之后,我们运行docker-compose run spark bash,即可使用连接上mongodb的spark(下图中的第一个实例)。此时,docker界面如图所示。
在这里插入图片描述
vscode中的我们也可以看到两个打开的实例。右键点击Attach in New Window即可在新的窗口打开,非常方便的进入容器内部,查看文件、上传下载文件等。
在这里插入图片描述
后续步骤参考readme文件即可。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值