CDH6.3.2 Spark ON Yarn配置使用

初始化

export SPARK_HOME=/XXXX

spark程序打包依赖分离

mvn dependency:copy-dependencies -DoutputDirectory=libs

将libs压缩为libs.zip上传到服务器或hdfs的/spark-yarn/jars

local模式配置依赖jars

mkdir -p /tmp/spark/jars
cd /tmp/spark/jars
#上传libs.zip 命令不存在yum install -y lrzsz
rz
unzip libs.zip

修改spark-defaults.conf配置,添加以下内容

#spark local jars
spark.executor.extraClassPath=/tmp/spark/jars/libs/*
spark.driver.extraClassPath=/tmp/spark/jars/libs/*

local模式执行测试

${SPARK_HOME}/bin/spark-submit --master local --class com.xxx.spark.dw.dwd.DWDDebugCommonModel --driver-cores 1 --driver-memory 2G --num-executors 2 --executor-cores 2 --executor-memory 4G --name 测试 /opt/software/pkgs/xxx.jar

Client或Cluster模式配置依赖jars

快速测试client模式,将hdfs路径改为local:/tmp/spark/jars/libs

上传jars到hdfs

hdfs dfs -put /tmp/spark/jars/libs/* /spark-yarn/jars/

修改spark-defaults.conf文件将spark.yarn.jars的值改为

spark.yarn.jars=local:/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/spark/jars/*,local:/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/lib/spark/hive/*,local:/tmp/spark/jars/libs/*
说明:

本地路径格式 local:/xx

hdfs路径格式 hdfs://master:8020/xx

YRAN提交任务
${SPARK_HOME}/bin/spark-submit --master yarn --deploy-mode client|cluster --class com.iflytek.spark.dw.dwd.DWDDebugCommonModel  --driver-cores 1 --driver-memory 2G --num-executors 2 --executor-cores 2 --executor-memory 4G --name 测试 /opt/software/pkgs/dataoperation.jar
client模式

driver在客户端(调试)

cluster模式

driver在集群(生产)

问题说明

如果遇到local,client,cluster提交部分失败,报错java.lang.NoSuchMethodError

将spark-defaults.conf中的注释掉,只保留spark.yarn.jars,确保没有把依赖复制到spark/jars等目录

#spark local jars
#spark.executor.extraClassPath=/tmp/spark/jars/libs/*
#spark.driver.extraClassPath=/tmp/spark/jars/libs/*

Spark或Yarn中文乱码

解决方法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值