数据仓库工程师面试经验（2019）

最新推荐文章于 2023-11-02 13:38:32 发布

resin_404

最新推荐文章于 2023-11-02 13:38:32 发布

阅读量4.4k

点赞数 12

分类专栏： hive数据仓库文章标签：数据仓库面试经验数据仓库工程师

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/resin_404/article/details/100772612

版权

hive数据仓库专栏收录该内容

6 篇文章 2 订阅

订阅专栏

所有面试的前奏：

先简要的介绍一下自己！

这句话基本上是所有面试官问的第一个问题，这个问题我的应对策略是：

1. 简要介绍何时毕业于哪所学校（姓名，籍贯可选择）
2. 从近往远介绍开始介绍工作经验
3. 大厂大项目靠前介绍，其他情况靠后
4. 小项目简要介绍一两句话概括
5. 重要介绍和自己面试岗位匹配的项目，并且需要调理分明

后续就是按照你上面介绍的项目具体询问各种细节问题，下面罗列一下自己遇到的相关面试问题：

一、某团面试问题

数据分层情况和原因，解决的什么问题
数据抽取和同步的方法
join的表中筛选和where中筛选有什么区别（谓词下推）
范式建模和维度建模的区别，应用场景的区别，优缺点
sql 分组三类函数的区别
拉链表的实现
手写计算器java实现
手写排序算法（快速排序）
手写sql，基本上是实现排序分组去top5的类型，随意修改要求说出统计思路
linux过滤命令 grep -A / -B 去固定行的上下几行
hive整个调优过程做了哪些
hive数仓整体架构，实现过程，有哪些问题，是怎样解决的
元数据是怎样管理的？元数据中都包括了那些数据
mapreduce 执行原理
hive的窗口函数

二、某汽车行业大厂

Hive 和MySQL的区别
元数据是怎么应用的
Sql优化都做了哪些？
分区和分桶具体怎么实现的？
解决问题的处理思路和具体问题举例说明解决过程
调度框架的运行机制和原理
数据仓库整体架构
Hive 支持的底层数据文件类型有哪些
元数据，技术元数据和业务元数据都包含了哪些？
元数据怎样管理
怎样保证数据质量
监控都做了哪些
怎样实现历史拉链
IBM范式建模的七大主题是什么？其中怎样理解当事人主题
数据仓库的容量，日增数据量
关系型数据库到hive 效率提升的拐点是什么？就是多大数据量后关系型数据库计算效率不如hive

三、其他（上面重复的不在赘述）

数据表的分组和分块？怎样完成数据的分组，并且在分组后按照一定的维度分块
为什么要用Hbase 而不用关系型数据库？
简要介绍一下mapreduce执行时的数据流转

四、必问项（表现不错的话）

从上家公司离职的原因
你的职业规划
你对面试官还有什么想问的吗？

虽然都说大环境不好，但是工作机会还是有，需要多做准备，还是可以找到心仪的工作的！

关注

12
点赞
踩
101

收藏

觉得还不错? 一键收藏
5
评论
数据仓库工程师面试经验（2019）

数据仓库面试经验分享（2019年）
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。