挑一最擅长的项目说说
1.数据清洗的MapReduce程序
2.spark和Hadoop的区别
3.MapReduce的工作流程
4.shuffle机制
5.数据倾斜
6.数据结构:二叉树 第n层的节点数 深度为h的节点数
7.Linux的基本命令 编辑 复制 删除
8.mysql题:
name kecheng fenshu
张三 语文 81
张三 数学 75
李四 语文 76
李四 数学 90
王五 语文 81
王五 数学 100
王五 英语 90;、
求出每科的最高成绩(主要考察分桶)
9.sparkStreaming处理实时数据流的原理
10.spark提交任务的算子
11.第二项目
面试官(小姐姐哦)的建议:
会一些简单的算法
SQL一定要会
spark比较重要
MapReduce一定要会
spark相关的项目很重要
会flink更好