面试问题
1.了解哪些大数据组件,单个说明。
2.熟悉Scala吗?不熟悉
3.熟悉SQL?内连接,左外连接,右外连接的区别
4.熟悉Linux命令?基础的,上传文件到hdfs用到的命令。
5.Maven用过吗?
6.Set和Map的区别?存放值?继承哪些类?实现哪些接口?
7.项目。序列化→Json?怎么实现的
8.设计题 10个reduce节点,其中9个很快执行完成,有一个执行很慢,怎么优化?数据倾斜?
9.论文,研究,实习时间,机器学习算法(主要神经网络)。
面试问题
1.了解哪些大数据组件,单个说明。
2.熟悉Scala吗?不熟悉
3.熟悉SQL?内连接,左外连接,右外连接的区别
4.熟悉Linux命令?基础的,上传文件到hdfs用到的命令。
5.Maven用过吗?
6.Set和Map的区别?存放值?继承哪些类?实现哪些接口?
7.项目。序列化→Json?怎么实现的
8.设计题 10个reduce节点,其中9个很快执行完成,有一个执行很慢,怎么优化?数据倾斜?
9.论文,研究,实习时间,机器学习算法(主要神经网络)。