Spark实例创建及参数解释

最新推荐文章于 2023-04-16 17:51:37 发布

菜农1024

最新推荐文章于 2023-04-16 17:51:37 发布

阅读量358

点赞数

分类专栏： Spark 文章标签： spark

原文链接：https://www.cnblogs.com/zzhangyuhang/p/9039695.html

版权

Spark 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

def get_sparkSession(myApp):
    conf = (SparkConf().setMaster("yarn").setAppName(myApp)
            .set("spark.executor.memory", "2g")
            .set('hive.exec.dynamic.partition', 'true')
            .set('spark.sql.autoBroadcastJoinThreshold','-1')
            .set('hive.exec.dynamic.partition.mode', 'nostrick')
            .set('hive.exec.max.dynamic.partitions', '100000')
            .set('hive.exec.max.dynamic.partitions.pernode', '100000')
            .set("spark.port.maxRetries", "100")
            )
    spark = SparkSession.builder.config(conf=conf).enableHiveSupport().getOrCreate()
    # SparkSession 是 Spark SQL 的入口，使用 Dataset 或者 Datafram 编写 Spark SQL 应用的时候，第一个要创建的对象就是 SparkSession。
    # Builder 是 SparkSession 的构造器。 通过 Builder, 可以添加各种配置。
    return spark

在这里插入图片描述

参数参考： http://spark.apachecn.org/#/docs/20

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

菜农1024

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Spark实例创建及参数解释

def get_sparkSession(myApp): conf = (SparkConf().setMaster("yarn").setAppName(myApp) .set("spark.executor.memory", "2g") .set('hive.exec.dynamic.partition', 'true') .set('spark.sql.autoBroadcastJoinThreshold','-1')
复制链接

扫一扫