spark和hive常用调优参数(具体需根据数据来确定大小)

最新推荐文章于 2023-08-24 11:23:44 发布

vikings_lau

最新推荐文章于 2023-08-24 11:23:44 发布

阅读量597

点赞数 1

文章标签： hive spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vikings_lau/article/details/130762389

版权

本文列举了用于优化Spark和Hive性能的关键配置参数，包括动态分区策略、并行度设置、内存分配、广播阈值以及MapReduce输入格式和split大小等，旨在提升大数据处理效率。

摘要由CSDN通过智能技术生成

SAPRK
SET spark.sql.sources.partitionOverwriteMode = DYNAMIC;
SET spark.hadoop.hive.exec.dynamic.partition.mod = nonstrict;
SET hive.exec.dynamic.partition.mode = nonstrict;
SET spark.default.parallelism = 1600;
SET spark.sql.shuffle.partitions = 1600;
SET spark.executor.memoryOverhead = 5G;
SET spark.debug.maxToStringFields = 10000;
SET spark.sql.debug.maxToStringFields = 10000;
SET spark.hadoop.hive.exec.max.dynamic.partitions = 11000;
SET spark.hadoop.hive.exec.max.dynamic.partitions.pernode = 1512;
SET spark.memory.offHeap.size = 4G;
SET spark.driver.memoryOverhead = 4G;
SET spark.memory.offHeap.enabled = TRUE;
SET spark.sql.legacy.parquet.int96RebaseModeInWrite = LEGACY;
SET spark.kryoserializer.buffer.max = 2000;
SET spark.storage.memoryFraction = 0.7;
SET spark.shuffle.memoryFraction = 0.7;
SET spark.sh

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
spark和hive常用调优参数(具体需根据数据来确定大小)

- 触发广播join 的大小控制 , 这里写了1G , 非必要这里够大了, 一般调整100M 足以 (维度表)-- 每个executor内存大小,默认512m ,这里得依据yarn 实际大小限制配额做调整。-- 每个executor使用的CPU核数，默认为1。-- 以下语句必须配置在右侧环境参数中才生效。-- ##启动的executor的数量，默认为1。
复制链接

扫一扫

vikings_lau CSDN认证博客专家 CSDN认证企业博客

码龄2年

8: 原创

136万+: 周排名

59万+: 总排名

4395: 访问

: 等级

86: 积分

2: 粉丝

1: 获赞

1: 评论

9: 收藏

私信

关注

热门文章

最新评论

spark和hive常用调优参数(具体需根据数据来确定大小)
CSDN-Ada助手: 非常感谢用户分享的关于spark和hive常用调优参数的博客，这对于我们在实际应用中优化数据处理流程非常有帮助。祝贺用户写了第8篇博客，持续创作是非常值得肯定的。希望用户能够继续分享更多的数据处理技巧和经验，以便我们更好地应对数据分析的挑战。同时也建议用户可以结合实际案例，分享一些实际场景下的数据处理思路和方法，这将更具参考价值。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
Oracle行转列写法
CSDN-Ada助手: 非常感谢您分享了这篇有关Oracle行转列的文章，阐述了非常有用的写法。很高兴看到您在持续创作，不断分享您的经验和知识。您的博客对于想要学习Oracle的人来说是非常有益的。接下来，我建议您可以继续分享一些实战经验和案例，这样可以更好地帮助读者理解Oracle知识的应用。同时，也希望您可以多关注一些Oracle的新技术和发展趋势，分享给读者更多有价值的内容。谢谢您的分享，期待您的下一篇博客。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。