spark代码idea、yarn、standalone模式运行

最新推荐文章于 2024-05-20 16:20:35 发布

新宿一次狼

最新推荐文章于 2024-05-20 16:20:35 发布

阅读量556

点赞数

分类专栏： spark 文章标签：大数据

本文链接：https://blog.csdn.net/youmianzhou/article/details/109704546

版权

spark 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1.idea上运行

val conf = new SparkConf().setAppName("SparkRDDWordCount")
      .setMaster("local[*]")   //设置本地模式，用尽可能多的cpu

2.yarn
yarn模式分client客户端模式和cluster集群模式
测试可以用client模式
生产环境用cluster模式

yarn模式运行spark，可以不用启动spark集群。这是与standalone模式的一个区别。
还有查看运行的日志端口不同，yarn是在8088端口
http://node01:8088/cluster

// yarn+cluter 模式
bin/spark-submit \
--class org.example.WordCount \
--master yarn \        // yarn模式提交
--deploy-mode cluster \    //cluster模式
--driver-memory 1g \
--executor-memory 1g \
--executor-cores 1 \
./examples/jars/spark_submit-1.0-SNAPSHOT.jar

// yarn+client 模式
bin/spark-submit \
--class org.example.WordCount \
--master yarn \        // yarn模式提交
--deploy-mode client \    //client模式
--driver-memory 1g \
--executor-memory 1g \
--executor-cores 1 \
./examples/jars/spark_submit-1.0-SNAPSHOT.jar

3.standalone模式
需要启动spark集群，用的是spark自己的资源调度系统。
standalone的提交命令与yarn不同的是 --master 后面的参数不一样，其他一样
查看运行日志http://node01:8080

// standalone+cluter 模式
bin/spark-submit \
--class org.example.WordCount \
--master spark://node01:7077 \      // spark的集群地址
--deploy-mode cluster \    //cluster模式
--driver-memory 1g \
--executor-memory 1g \
--executor-cores 1 \
./examples/jars/spark_submit-1.0-SNAPSHOT.jar

// standalone+client 模式
bin/spark-submit \
--class org.example.WordCount \
--master spark://node01:7077 \      // spark的集群地址
--deploy-mode client \    //cluster模式
--driver-memory 1g \
--executor-memory 1g \
--executor-cores 1 \
./examples/jars/spark_submit-1.0-SNAPSHOT.jar

新宿一次狼

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark代码idea、yarn、standalone模式运行

1.idea上运行val conf = new SparkConf().setAppName("SparkRDDWordCount") .setMaster("local[*]") //设置本地模式，用尽可能多的cpu2.yarnyarn模式分client客户端模式和cluster集群模式测试可以用client模式生产环境用cluster模式yarn模式运行spark，可以不用启动spark集群。这是与standalone模式的一个区别。还有查看运行的日志端口不同，yarn是
复制链接

扫一扫

专栏目录