spark集群模式

第一种:
val conf: SparkConf = new SparkConf()
conf.setAppName("SparkWC")
conf.setMaster("spark://spark1:7077")如果这样写的话 直接就在集群上面执行了(idea种)

使用spark-submit不用指定 master了就

./spark-submit  \

--class day06.SparkWC \

--executor-memory 512m \

--total-executor-cores 2 /home/hadoop02/sparkTools/sparkDemo-1.0-SNAPSHOT.jar

第二种:
val conf: SparkConf = new SparkConf()
conf.setAppName("SparkWC")
//conf.setMaster("local")如果这样写的话 或者不加注释 写上local 在idea种无法跑集群,在spark-shell使用如下

使用spark-submit不用指定 master了就

./spark-submit  \

--class day06.SparkWC \

--master spark://spark1:7077 \

--executor-memory 512m \

--total-executor-cores 2 /home/hadoop02/sparkTools/sparkDemo-1.0-SNAPSHOT.jar

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Spark集群模式中,可以通过以下几种方式来获取Minio的连接配置: 1. 将Minio的连接配置信息保存在一个配置文件中,然后在Spark应用程序中读取配置文件并解析配置信息。例如,可以将配置文件保存在HDFS上,并使用Spark的API读取配置文件中的信息。 2. 在Spark应用程序中使用命令行参数传递Minio的连接配置信息。例如,可以通过指定命令行参数来传递Minio的access key、secret key、endpoint等信息。 3. 将Minio的连接配置信息保存在Spark的配置文件中,并在应用程序中读取配置信息。例如,可以在spark-defaults.conf文件中添加以下配置项: spark.hadoop.fs.s3a.access.key=<access_key> spark.hadoop.fs.s3a.secret.key=<secret_key> spark.hadoop.fs.s3a.endpoint=<minio_endpoint> 然后在应用程序中,可以使用Spark的API来获取配置项的值。例如,可以使用以下代码来获取Minio的access key: val accessKey = spark.sparkContext.getConf.get("spark.hadoop.fs.s3a.access.key") 需要注意的是,以上方法中的配置信息需要在driver和executor上都能够访问到。因此,如果需要在executor上访问Minio,需要将配置信息传递给executor。可以使用Spark的Broadcast变量来传递配置信息。例如,可以将Minio的access key使用Broadcast变量广播到所有的executor上: val accessKey = spark.sparkContext.broadcast(spark.sparkContext.getConf.get("spark.hadoop.fs.s3a.access.key")) 然后在executor上,可以通过accessKey.value来获取Minio的access key。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值