Spark sql 优化小文件

最新推荐文章于 2024-08-11 02:55:40 发布

吓人一跳

最新推荐文章于 2024-08-11 02:55:40 发布

阅读量587

点赞数

分类专栏： Spark 文章标签： spark

本文链接：https://blog.csdn.net/weixin_38073361/article/details/109307821

版权

Spark 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

近期和一些朋友讨论了一些关于Spark 减少小文件的方案，这里记录一下，版权所有《大数据私房菜》微信技术群之 “HowardZack”

1. 贴上配置文件

  spark - submit \
   --conf spark.sql.adaptive.enabled = true \
   --conf spark.sql.adaptive.shuffle.targetPostShuffleInputSize = 134217728 \
   --conf spark.sql.auto.repartition = true \

   # 以下配置是针对join操作进行的性能优化
   --conf spark.sql.adaptive.join.enabled = true \
   --conf spark.sql.adaptive.skewJoin.enabled = true \
   --conf spark.shuffle.consolidateFiles = true \
   --conf spark.shuffle.service.enabled = true \
   --conf spark.sql.adaptive.allowAdditionalShuffle = true

2. 后续有更新都会贴上

记录在这里只是方便查看，以免丢失，版权保持为上述原作者所有

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

吓人一跳 CSDN认证博客专家 CSDN认证企业博客

码龄7年

18: 原创

11万+: 周排名

59万+: 总排名

4万+: 访问

: 等级

668: 积分

10: 粉丝

40: 获赞

29: 评论

116: 收藏

私信

关注

热门文章

分类专栏

ELK 4篇
Hive
Spark 3篇
CDH组件 3篇
HDFS 3篇
Flink
python 1篇
ClickHouse 1篇
superset 3篇
Linux 2篇

最新评论

Hive经典SQL之行转列，列转行
吓人一跳: 行转列 / 列转行的含义你是不是不太清楚
Logstash实现自定义插件在filter中读取redis数据(详细版)
CSDN-Ada助手: 非常感谢你的分享，这篇博客详细介绍了如何在filter中使用自定义插件读取redis数据，对于想要深入了解Logstash的用户来说非常有价值。我建议你可以继续写一篇关于如何使用Logstash实现数据分析和可视化的博客，这样的技术文章对其他用户也会很有帮助，相信会有更多读者受益于你的分享。期待你的下一篇精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Hive经典SQL之行转列，列转行
1二三: 可是啊，可是啊，还是三列啊
Hive经典SQL之行转列，列转行
吓人一跳: 一行展开多行展开之后的一个ID，你创建执行一下就知道了
Hive经典SQL之行转列，列转行
如果可以a: lateral view 后面跟的cr，sc是啥？没指定啊

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。