Spark 集群模式

Spark 集群搭建

        a)复制spark目录到其他主机
        b)配置其他主机的所有环境变量
            [/etc/profile]
            SPARK_HOME
            PATH

        c)配置master节点的slaves
            [/soft/spark/conf/slaves]
            s202
            s203
            s204
        
        d)启动spark集群
            /soft/spark/sbin/start-all.sh

注:此处有可能报错: java home is not set

事实上我们在环境变量肯定是设置了java home

解决办法:在spark的sbin目录下的 spark-config.sh中添加java home

[/soft/spark/sbin/spark-config.sh]

export JAVA_HOME=/soft/jdk

        e)查看进程
            $>xcall.jps jps
                master        //s201
                worker        //s202
                worker        //s203
                worker        //s204
        e)webui
            http://s201:8080/

 

提交作业jar到完全分布式spark集群

    1.需要启动hadoop集群(只需要hdfs)
        $>start-dfs.sh
    2.put文件到hdfs.        
    3.运行spark-submit
        $>spark-submit 
                    --master spark://s201:7077 
                    --name MyWordCount 
                    --class com.mao.scala.scala.WordCountScala
                    SparkDemo1-1.0-SNAPSHOT.jar 
                    hdfs://s201:8020/user/centos/test.txt

 

Spark集群模式中,可以通过以下几种方式来获取Minio的连接配置: 1. 将Minio的连接配置信息保存在一个配置文件中,然后在Spark应用程序中读取配置文件并解析配置信息。例如,可以将配置文件保存在HDFS上,并使用Spark的API读取配置文件中的信息。 2. 在Spark应用程序中使用命令行参数传递Minio的连接配置信息。例如,可以通过指定命令行参数来传递Minio的access key、secret key、endpoint等信息。 3. 将Minio的连接配置信息保存在Spark的配置文件中,并在应用程序中读取配置信息。例如,可以在spark-defaults.conf文件中添加以下配置项: spark.hadoop.fs.s3a.access.key=<access_key> spark.hadoop.fs.s3a.secret.key=<secret_key> spark.hadoop.fs.s3a.endpoint=<minio_endpoint> 然后在应用程序中,可以使用Spark的API来获取配置项的值。例如,可以使用以下代码来获取Minio的access key: val accessKey = spark.sparkContext.getConf.get("spark.hadoop.fs.s3a.access.key") 需要注意的是,以上方法中的配置信息需要在driver和executor上都能够访问到。因此,如果需要在executor上访问Minio,需要将配置信息传递给executor。可以使用Spark的Broadcast变量来传递配置信息。例如,可以将Minio的access key使用Broadcast变量广播到所有的executor上: val accessKey = spark.sparkContext.broadcast(spark.sparkContext.getConf.get("spark.hadoop.fs.s3a.access.key")) 然后在executor上,可以通过accessKey.value来获取Minio的access key。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值