大数据开发实习面试复盘

最新推荐文章于 2024-07-24 08:23:26 发布

明明不会打代码

最新推荐文章于 2024-07-24 08:23:26 发布

阅读量195

点赞数 1

文章标签： hive hadoop kafka flume flink 大数据数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62336238/article/details/140458842

版权

自我介绍，

介绍自己写的两个项目（离线和实时）

数仓分层是怎么分的？

数仓建模使用的是什么？我回答的ER 实体模型。应该是维度模型

问基础知识：

hadoop的读写流程介绍一下？第一遍·完成

两个项目离线，实时用的编程语言用的什么？我回的java

java介绍一下你平时常用的集合有哪些？在项目中如何使用的？

有没有用到hive的窗口函数，介绍一下，

数仓·中有没有遇到一些数据清洗，有没有一些比较巧妙的方法，怎么进行数据清洗的，

当大表join小表时，会出现什么情况第一遍完成

kafka的分区策略有了解吗？第一遍完成

kafka的消息积压问题有没有遇到过？怎么解决的，数据写得很多，写到kafka导致数据积压，第一遍完成

kafka数据是有序的吗？第一遍完成

实时数仓用的flinkSQL还是dataStream, flinkSql (用户行为日志 json格式数据 StreamAPI)

(业务数据明细数据 flinkSQL)

ads层或是最上层的数据都是写到哪里面的（dim层写到Hbase里面，dwd层写到kafka ）

Hbase的rowkey是怎么设计的？rowKey的设计原则，有没有经验积累？第一遍完成

数据同步用的maxwell，用它的原因是什么第一遍完成

flinkSql用的流式数据，数据万一坏了，有什么恢复机制？第一遍完成

实时数仓用到过spark没有？没用到

离线数仓建模用的什么建模？数仓怎么建模讲一下

离线数仓的很多小文件问题是怎么解决的？第一遍完成

zookeeper用过吗？zookeepr命令知道有什么常用的？第一遍完成

实时数仓的Flink...没听过一个东西最后听那个是什么

你觉得写离线数仓实时数仓过程中的难点是什么？

两个项目的环境都是自己搭建的吗？（最自信的）

结束感谢

明明不会打代码

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据开发实习面试复盘

ads层或是最上层的数据都是写到哪里面的（dim层写到Hbase里面，dwd层写到kafka ）怎么解决的，数据写得很多，写到kafka导致数据积压，第一遍完成。Hbase的rowkey是怎么设计的？数仓·中有没有遇到一些数据清洗，有没有一些比较巧妙的方法，怎么进行数据清洗的，flinkSql用的流式数据，数据万一坏了，有什么恢复机制？在项目中如何使用的？数据同步用的maxwell，用它的原因是什么第一遍完成。两个项目离线，实时用的编程语言用的什么？离线数仓的很多小文件问题是怎么解决的？
复制链接

扫一扫

明明不会打代码 CSDN认证博客专家 CSDN认证企业博客

码龄3年

29: 原创

74万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

486: 积分

158: 粉丝

191: 获赞

5: 评论

121: 收藏

私信

关注

热门文章

最新评论

LookUpJoin
CSDN-Ada助手: 恭喜您发布了新的博客“LookUpJoin”！持续创作是非常了不起的事情，您对这个主题的探索和分享无疑会让更多人受益。或许接下来可以考虑加入一些实例分析或者案例研究，更具体地展示“LookUpJoin”的应用场景和效果，让读者更容易理解和应用。期待您的下一篇作品！
数仓建模用的什么模型
CSDN-Ada助手: 恭喜您发布了第18篇博客！标题“数仓建模用的什么模型”引人深思，内容必定精彩。在数仓建模领域，选择合适的模型确实至关重要。希望您能继续保持创作的热情和努力，探索更多关于数仓建模的知识，并分享给更多的读者。或许下一步可以深入探讨各种模型的优缺点，以及在实际应用中的比较与选择。期待您更多精彩的文章！
HIVE 和 join 有关的优化问题
CSDN-Ada助手: 恭喜您发布了第19篇博客，这是一个了不起的里程碑！对于HIVE和join相关的优化问题的探讨，您的文章内容十分有价值，对读者来说无疑是一次知识的盛宴。接下来，我建议您可以继续深入研究HIVE和join的优化策略，或者探讨一些实际案例，为读者提供更多实用的技术指导。期待您更多精彩的创作！
Zookeeper 常用的一些命令
CSDN-Ada助手: 恭喜您发布了第20篇博客，标题为“Zookeeper 常用的一些命令”，内容相信对读者们会有很大帮助。您的持续创作精神令人钦佩！接下来，我建议您可以尝试深挖Zookeeper的一些高级功能，或者分享一些实战经验，让读者们能够更加全面地了解和运用Zookeeper。期待您更多精彩的博客！
QQ，微信小惊喜代码
Eason_LYC: 这个好吧欢迎回访关注

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。