Spark-SQL与hive整合【版本spark1.6.0+hive0.14】--Standalone模式

最新推荐文章于 2023-02-02 11:02:14 发布

奔跑-起点

最新推荐文章于 2023-02-02 11:02:14 发布

阅读量2.7k

点赞数 1

分类专栏： spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bbaiggey/article/details/50845208

版权

在进行离线大数据处理工程中，使用hive进行运算出现了瓶颈，由于文件太大，集群的block块采用的是默认128M没有进行调整，而且集群规模比较小，只有4个节点，

机器配置：

2台32core,内存14.5G

1台32core，内存30.3G

1台32core，内存46.1 G

在进行分析过程中，有大量的left jion和group by 以及sum count HQL各种嵌套[主要是当初设计的不合理，下边的没有经验，按照普通的RDB来使用了]，在使用hive分析过程中，文件特别大，会启动很多的mapper，因此需要申请大量的containers需要大量内存，由于内存不足常常导致nodeMannger自杀，(yarn调度配置采用的是默认配置){

最低0.47元/天解锁文章

奔跑-起点 CSDN认证博客专家 CSDN认证企业博客

码龄14年

207: 原创

13万+: 周排名

71万+: 总排名

60万+: 访问

: 等级

7120: 积分

127: 粉丝

99: 获赞

37: 评论

159: 收藏

私信

关注

热门文章

分类专栏

最新评论

linux修改max user processes limits
一顷: 请问修改这个参数会影响最大网络传输时间等相关网络的性能么
史上最全使用Nexus搭建Maven服务器详细配置
毁灭y: 写的真烂，不想多看一下
Spring Boot DATA JPA抓取SQL运行时的传递进去的参数信息
冰羽IOX: 在application.yml添加配置 logging: level: org.hibernate.type.descriptor.sql.BasicBinder: trace 控制台输出 Hibernate: insert into t_user (password, username) values (?, ?) 2020-06-25 16:33:28.105 TRACE 2559 --- [io-60622-exec-2] o.h.type.descriptor.sql.BasicBinder : binding parameter [1] as [VARCHAR] - [2020-06-151] 2020-06-25 16:33:28.105 TRACE 2559 --- [io-60622-exec-2] o.h.type.descriptor.sql.BasicBinder : binding parameter [2] as [VARCHAR] - [测试]
读万卷书不如行万里路，行万里路不如阅人无数，阅人无数不如名师指路，名师指路不如自己去悟
则若: 文章很赞，和我最近的认知升级有异曲同工之妙，感谢指点
Netty4.0学习笔记系列之四：混合使用coder和handler
xzlAwin: 路径好像不太正确 import static io.netty.handler.codec.http.HttpHeaders.Names.CONTENT_TYPE; 正确的是 import static io.netty.handler.codec.http.HttpHeaderNames.CONTENT_TYPE;

大家在看

如何将 Kubernetes 中的两个 Nginx Ingress 合并成一个：操作步骤与注意事项 1164

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。