所有面试的前奏:
先简要的介绍一下自己!
这句话基本上是所有面试官问的第一个问题,这个问题我的应对策略是:
1. 简要介绍何时毕业于哪所学校(姓名,籍贯可选择)
2. 从近往远介绍开始介绍工作经验
3. 大厂大项目靠前介绍,其他情况靠后
4. 小项目简要介绍一两句话概括
5. 重要介绍和自己面试岗位匹配的项目,并且需要调理分明
后续就是按照你上面介绍的项目具体询问各种细节问题,下面罗列一下自己遇到的相关面试问题:
一、某团面试问题
- 数据分层情况和原因,解决的什么问题
- 数据抽取和同步的方法
- join的表中筛选和where中筛选有什么区别 (谓词下推)
- 范式建模和维度建模的区别,应用场景的区别,优缺点
- sql 分组三类函数的区别
- 拉链表的实现
- 手写计算器java实现
- 手写排序算法(快速排序)
- 手写sql,基本上是实现排序分组去top5的类型,随意修改要求说出统计思路
- linux过滤命令 grep -A / -B 去固定行的上下几行
- hive整个调优过程做了哪些
- hive数仓整体架构,实现过程,有哪些问题,是怎样解决的
- 元数据是怎样管理的? 元数据中都包括了那些数据
- mapreduce 执行原理
- hive的窗口函数
二、某汽车行业大厂
- Hive 和MySQL的区别
- 元数据是怎么应用的
- Sql优化都做了哪些?
- 分区和分桶具体怎么实现的?
- 解决问题的处理思路和具体问题举例说明解决过程
- 调度框架的运行机制和原理
- 数据仓库整体架构
- Hive 支持的底层数据文件类型有哪些
- 元数据,技术元数据和业务元数据都包含了哪些?
- 元数据怎样管理
- 怎样保证数据质量
- 监控都做了哪些
- 怎样实现历史拉链
- IBM范式建模的七大主题是什么?其中怎样理解当事人主题
- 数据仓库的容量,日增数据量
- 关系型数据库到hive 效率提升的拐点是什么?就是多大数据量后关系型数据库计算效率不如hive
三、其他(上面重复的不在赘述)
- 数据表的分组和分块? 怎样完成数据的分组,并且在分组后按照一定的维度分块
- 为什么要用Hbase 而不用关系型数据库?
- 简要介绍一下mapreduce执行时的数据流转
四、必问项(表现不错的话)
- 从上家公司离职的原因
- 你的职业规划
- 你对面试官还有什么想问的吗?
虽然都说大环境不好,但是工作机会还是有,需要多做准备,还是可以找到心仪的工作的!