hive优化--从二十个小时到五分钟的跨度

最新推荐文章于 2022-05-17 11:17:30 发布

VIP文章暁洣

最新推荐文章于 2022-05-17 11:17:30 发布

阅读量315

点赞数 2

分类专栏： Hive 文章标签：大数据 hive hive优化

本文链接：https://blog.csdn.net/weixin_43192721/article/details/95334406

版权

背景

上个月，做了一个业务背景比较复杂，涉及表众多的etl处理，在整个过程中遇到了很多坑，其中最大的一个坑是，在整个s q l的处理过程中，有一段sql的执行花费时间较长，执行了二十多个小时未结束。严重影响了etl的进度，对此进行了一些列的优化，但效果甚微。

解决

具体的sql如下：（涉及业务隐私，表名和列名就简化了）

select * from 
(select * from a1 where filedate='${filedate}') t1 left join
(select * from a2 where filedate='${filedate}') t2 left join
(select * from a3 where filedate='${filedate}') t3 left join
(

最低0.47元/天解锁文章

优惠劵

暁洣

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
hive优化--从二十个小时到五分钟的跨度

背景上个月，做了一个业务背景比较复杂，涉及表众多的etl处理，在整个过程中遇到了很多坑，其中最大的一个坑是，在整个s q l的处理过程中，有一段sql的执行花费时间较长，执行了二十多个小时未结束。严重影响了etl的进度，对此进行了一些列的优化，但效果甚微。解决具体的sql如下：（涉及业务隐私，表名和列名就简化了）select * from (select * from a1 where ...
复制链接

扫一扫