使用docker构建spark运行环境

最新推荐文章于 2025-04-08 15:10:52 发布

Dragon_qing

最新推荐文章于 2025-04-08 15:10:52 发布

阅读量4.2k

点赞数 2

文章标签： spark docker 容器

本文链接：https://blog.csdn.net/Dragon_qing/article/details/124549698

版权

使用docker构建spark运行环境

测试：创建RDD与filter处理

安装docker与docker-compose

可参考
https://blog.csdn.net/Dragon_qing/article/details/124416383

系统构架图：

[(./images/spark-env.png)]

使用docker hub查找我们需要的镜像。
在这里插入图片描述

在这里插入图片描述

docker compose部署文件：

version: '3.8'

services:
  spark-master:
    image: bde2020/spark-master:3.2.0-hadoop3.2
    container_name: spark-master
    ports:
      - "8080:8080"
      - "7077:7077"
    volumes:
      - ~/spark:/data
    environment:
      - INIT_DAEMON_STEP=setup_spark
  spark-worker-1:
    image: bde2020/spark-worker:3.2.0-hadoop3.2
    container_name: spark-worker-1
    depends_on:
      - spark-master
    ports:
      - "8081:8081"
    volumes:
      - ~/spark:/data
    environment:
      - "SPARK_MASTER=spark://spark-master:7077"
  spark-worker-2:
    image: bde2020/spark-worker:3.2.0-hadoop3.2
    container_name: spark-worker-2
    depends_on:
      - spark-master
    ports:
      - "8082:8081"
    volumes:
      - ~spark:/data
    environment:
      - "SPARK_MASTER=spark://spark-master:7077"