伪集群&集群下运行Spark应用程序

Spark应用程序在集群中运行时,需要借助于集群管理器,如本地集群管理器、YARN、Mesos,来为其实现资源管理调度服务,实现对集群中各个机器的访问。

独立集群管理器

  • 启动Spark集群:略
  • 在集群中运行应用程序JAR包
    • 主节点参数
      • spark://master:7070(master为主节点主机名)
    • Linux Shell下命令
      • cd /usr/local/spark
      • bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://master:7077 examples/jars/spark-examples_2.12-3.0.1.jar 100 2>&1 | grep “Pi is roughly”
        在这里插入图片描述
  • 浏览器中输入地址http://master:8080/可以在独立集群管理Web界面查看应用的运行情况
    在这里插入图片描述
  • 在集群中运行spark-shell
    • hadoop fs -put /usr/local/spark/README.md /
    • spark-shell --master spark://master:7077
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

Hadoop YARN 管理器

  • 启动Spark集群:略

  • 在集群中运行应用程序JAR包

    向Hadoop YARN集群管理器提交应用,需要把yarn-cluster(新版本用yarn)作为主节点参数递给spark-submit

    • cd /usr/local/spark
    • bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn examples/jars/spark-examples_2.12-3.0.1.jar 100 2>&1 | grep “Pi is roughly”
    • 运行后,根据在Shell中得到输出的结果地址查看,如下图:
      在这里插入图片描述
      http://master:8088/proxy/application_1608023534325_0003/
      在这里插入图片描述
      在这里插入图片描述
  • 在集群中运行spark-shell

    • spark-shell --master yarn
      在这里插入图片描述
      在这里插入图片描述
  • 浏览器中输入地址http://master:8088/cluster 在Hadoop Yarn集群管理Web界面查看所有应用的运行情况
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值