虾皮
面试官问了很多spark 细节的问题。job划分,热点数据,小文件处理方式,shuffle,数据倾斜,orc文件的优势。
现在想起来,虽然答了,但是答得不好。
sql 没写出来。 分段平均和分段 top值
算法题,数组合并,正好是面试前看过的,但是整体没运行起来。
数组初始化 int[][] res={{1,2},{4,5},{2,8}};。
面试完挺难受的。
小米
算法题是删除数组重复值,写出来了。
问内存溢出怎么处理:
我们系统的excutor个数是多少。
出了个sql题,我都没懂这题是啥意思。
度小满
他们主要做数仓,不太匹配。