Spark on Yarn in single node

Env

Ubuntu 20.04
hadoop-3.1.3
hive-3.1.2-bin
spark-3.3.0-bin-hadoop3

spark-defaults.conf

spark.master yarn
spark.driver.memory 512m
spark.yarn.am.memory 512m
spark.executor.memory 512m

spark-env.sh

export HADOOP_HOME=/path/to/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export JAVA_HOME=/path/to/java
export SCALA_HOME=/path/to/scala

Start:

  1. spark-sql --driver-class-path /path/to/hive-3.1.2-bin/lib/mysql-connector-java-5.1.49.jar
  2. copy mysql driver: cp /path/to/mysql-connector-java-5.1.49.jar $SPARK_HOME/jars, then run spark-sql

Verify:
在这里插入图片描述

create tpcds dataset in Hive with: tpcds-for-hive-on-emr

errors

Failed to send RPC error:

Change yarn conf:

        <property>
              <name>yarn.scheduler.maximum-allocation-mb</name>
                <value>9216</value>
        </property>
        <property>
                <name>yarn.scheduler.minimum-allocation-mb</name>
                <value>4000</value>
        </property>
        <property>
                <name>yarn.nodemanager.vmem-pmem-ratio</name>
                <value>4.1</value>
        </property>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值