大数据线上问题排查系列 - 同样的HQL，在CDH与TDH平台执行效率差异巨大的根本原因与业务侧应对方案

最新推荐文章于 2023-01-05 17:04:00 发布

明哥的IT随笔

最新推荐文章于 2023-01-05 17:04:00 发布

阅读量538

点赞数

分类专栏：问题排查 hive 文章标签：大数据 spark hive

本文链接：https://blog.csdn.net/MichaelLi916/article/details/119711471

版权

本文探讨了在CDH和TDH平台上，相同HQL执行效率差异巨大的原因，重点在于两种平台的作业执行机制。在TDH中，SQL以Hive on Spark模式运行，预启动的Spark集群提高了执行效率，而CDH使用Hive on MR，导致性能下降。解决方案包括选择Hive on Spark，合理配置资源，以及业务代码优化。文章最后提出HIVE ON SPARK模式下资源管理的问题，引发思考。

摘要由CSDN通过智能技术生成

大数据线上问题排查系列 - 同样的HQL，在CDH与TDH平台执行效率差异巨大的根本原因与业务侧应对方案

前言

大家好，我是明哥！

公众号已经运维有一段时间了，也写了不少博文，其中很多是从自己解决真实线上问题的实战经历出发，写的经验总结和IT感悟。但由于前期摸索过程中，文风不统一且排版不太好，各篇博文之间也欠缺呼应，不太方便大家分类阅读学习，所以后续博文会尽量归类到对应的系列下。

本片博文是“大数据线上问题排查系列”大类别之一，以下是正文。

问题概述

某日测试团队同学跟我反馈了一个问题，即某大数据应用系统中HIVE离线计算作业脚本在CDH大数据平台跟TDH大数据平台的执行效率相差很大，经过验证该脚本在TDH大概需要 13 seconds，在CDH大概需要8 min 25 seconds，相差确实很大。

由于该大数据应用系统是是产品化的发包方案，在不同客户不同平台性能差异如此巨大，是不利于统一部署和运维的。所以需要对对该性能差异的背后原因，业务系统安装配置需注意的地方，以及业务代码侧潜在的应对方案，进行详尽的分析。

问题分析

问题分析的思路，仍然是查看相关大数据组件的WEB UI （在这里是 HIVE SERVER2 UI，和 YARN WEB UI）, 业务系统及各中间件的日志（涉及到业务系统日志，业务系统使用的到二方包三方包的日志，调度系统日志等），以及相关大数据组件的日志（在这里是 HIVE SERVER2, HIVE METASTORE,

最低0.47元/天解锁文章

明哥的IT随笔

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
大数据线上问题排查系列 - 同样的HQL，在CDH与TDH平台执行效率差异巨大的根本原因与业务侧应对方案

大数据线上问题排查系列 - 同样的HQL，在CDH与TDH平台执行效率差异巨大的根本原因与业务侧应对方案前言大家好，我是明哥！公众号已经运维有一段时间了，也写了不少博文，其中很多是从自己解决真实线上问题的实战经历出发，写的经验总结和IT感悟。但由于前期摸索过程中，文风不统一且排版不太好，各篇博文之间也欠缺呼应，不太方便大家分类阅读学习，所以后续博文会尽量归类到对应的系列下。本片博文是“大数据线上问题排查系列”大类别之一，以下是正文。问题概述某日测试团队同学跟我反馈了一个问题，即某大数据应用系统中
复制链接

扫一扫