阿里:
一面:
1.hive的MapReduce实现过程
2.hive中join的MapReduce过程
3.你在美团有遇到数据倾斜问题吗,如何解决的
4.实时数据如何保证容错性的
5.hashmap的实现原理
二面:
1.你在工作中如何处理数据倾斜的
2.distinct和group by的区别
3.假如group by导致数据倾斜,你怎么处理
4.hadoop和spark的区别有什么
5.spark streaming的容错机制
6.相对别人你的优势是什么
7.spark的原理
百度:
一面:
1.面向对象的特点,解释一下重写、重载、重定义
2.讲一下数据库的四种隔离级别
3.什么是幻读
4.栈有入栈和出栈,写一个函数得到栈的最大元素
5.数学题(连续3个数相乘为什么一定能被6整除)
因为连续三个数一定有一个数能被2整除,一个数能被3整除
美团:
一面:
1.TCP/IP协议
2.三次和四次握手
3.输入url后发生了什么过程
4.不用加号实现两个数相加
5.linux怎么每次读取文件的最新数据
京东:
一面:
1.传统数据仓库和数据库有什么不同
2.spark的shuffle阶段
3.你关注的新技术
4.给一个链表怎么判断他是不对称的
5.给一个数组找出等差数列的个数
6.http协议
7.websocket怎么确保获得数据的
8.查看linux后台的进程
9.linux的top命令