Spark Configuration

zhixingheyi_tian

已于 2023-07-10 16:41:14 修改

阅读量180

点赞数

分类专栏： spark 文章标签： spark

于 2021-09-24 14:38:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhixingheyi_tian/article/details/120454574

版权

spark 专栏收录该内容

106 篇文章 4 订阅

订阅专栏

Spark 使用本地文件系统

./bin/spark-shell --conf spark.hadoop.fs.defaultFS=file:///

USE_V1_SOURCE_LIST

sql/catalyst/src/main/scala/org/apache/spark/sql/internal/SQLConf.scala

  val USE_V1_SOURCE_LIST = buildConf("spark.sql.sources.useV1SourceList")
    .internal()
    .doc("A comma-separated list of data source short names or fully qualified data source " +
      "implementation class names for which Data Source V2 code path is disabled. These data " +
      "sources will fallback to Data Source V1 code path.")
    .version("3.0.0")
    .stringConf
    .createWithDefault("avro,csv,json,kafka,orc,parquet,text")

Shuffle 相关配置

spark.default.parallelism

For distributed shuffle operations like reduceByKey and join, the largest number of partitions in a parent RDD. For operations like parallelize with no parent RDDs, it depends on the cluster manager:
Local mode: number of cores on the local machine
Mesos fine grained mode: 8
Others: total number of cores on all executor nodes or 2, whichever is larger

spark.sql.shuffle.partitions

默认值为： 200	
The default number of partitions to use when shuffling data for joins or aggregations. 
Note: For structured streaming, this configuration cannot be changed between query restarts from the same checkpoint location.

zhixingheyi_tian

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark Configuration

Spark 使用本地文件系统./bin/spark-shell --conf spark.hadoop.fs.defaultFS=file:///
复制链接

扫一扫

专栏目录

zhixingheyi_tian CSDN认证博客专家 CSDN认证企业博客

码龄7年

444: 原创

3万+: 周排名

8225: 总排名

29万+: 访问

: 等级

6096: 积分

192: 粉丝

95: 获赞

90: 评论

205: 收藏

私信

关注

热门文章

分类专栏

最新评论

Yarn 源码
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
scala 之关键字 case
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。
Parquet 读文件源码剖析之 ParquetFileReader
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)提升标题与正文的相关性。
CentOS Mount Disk
CSDN-Ada助手: 如果一个服务部署在一组容器上运行，出现问题时，运维会做哪些快速诊断？
C语言那些事之动态库
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。