大数据面试
小朋友,你是否有很多问号?
这个作者很懒,什么都没留下…
展开
-
面试链接整理
连接最新大数据面试题真题总结(附答案)_liuhai的博客-CSDN博客_大数据常见面试题及答案原创 2022-03-01 08:01:41 · 1090 阅读 · 0 评论 -
部分面试题
1.广播变量和driver 中定义的普通变量的区别2.数据倾斜 优化的方式,怎样定位问题,有什么样的解决方案,有没有调参的方式能够解决的3.模型: (1)怎样评判汇总层的数据模型的好坏 (2)怎样应对业务变化 (3)分层的原则4.实时流join怎么做的,采用实时流相互等待借助外部缓存join,如果数据本身有重复,会进行多次join怎么解决的,如果数据延迟时间特别长问题怎么解决的5.spark tr...原创 2018-07-02 11:51:29 · 160 阅读 · 0 评论 -
面试题二
转自 https://blog.csdn.net/gospelanswer/article/details/70186659一.HQL部分 1.hql的行转列怎么实现 答:1.多个字段转一个字段可以使用union all 2.一个字段里面内容按逗号分隔转一个字段多行使用表生成函数,即:lateral view explode 2.count(distinct xxx)...原创 2018-07-18 09:06:38 · 246 阅读 · 0 评论 -
数仓面试题
hive优化https://blog.csdn.net/oracle8090/article/details/80008924https://blog.csdn.net/B11050101/article/details/787546521.hive表关联查询,造成数据倾斜的常见原因,如何解决数据倾斜2请说明hive中 sort by,order by,cluster by,dis...原创 2018-07-31 11:36:29 · 846 阅读 · 0 评论 -
错误集合
Exception in thread "main" java.lang.SecurityException: class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package解决办法(图文详解)...原创 2018-07-06 17:53:10 · 241 阅读 · 0 评论