2024年最新hive表通过元数据新增字段，大数据开发面试真题精选

最新推荐文章于 2024-11-04 16:01:37 发布

2401_84181501

最新推荐文章于 2024-11-04 16:01:37 发布

阅读量710

点赞数 12

分类专栏：程序员文章标签：大数据面试学习

本文链接：https://blog.csdn.net/2401_84181501/article/details/138644959

版权

程序员专栏收录该内容

154 篇文章 0 订阅

订阅专栏

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

join
partitions t2
on t1.tbl_id = t2.tbl_id
where
t1.tbl_name = ‘dwd_beforeloan_third_combine_id’

sds --存储信息表

第二步：

观察存储信息表的数据可以发现，存储信息表由sd_id作为主键，但对于同一表字段结构的分区来说，cd_id也是这张表这些分区在存储信息表中的共同主键。【注意，有些表，不同分区表字段的结构不一样，所以对应的cd_id也是不一样的】

我们找出这张表目前有几套表字段结构

先看看表本身
select
distinct cd_id
from
sds t110
join
(
   select
   t1.sd_id
   from
tbls t1
   where
   tbl_name = ‘dwd_beforeloan_third_combine_id’
) t120
on t110.sd_id = t120.sd_id

–结果cd_id = 361578

再结合表分区看看

select
distinct cd_id
from
sds t110
join
(
   select
   distinct t2.sd_id
   from
tbls t1
   join
partitions t2
   on t1.tbl_id = t2.tbl_id
   where
   t1.tbl_name = ‘dwd_beforeloan_third_combine_id’
) t120
on t110.sd_id = t120.sd_id

–结果cd_id = 361578