1.自我介绍
2.离职原因
3.说下hdfs读写流程
4.小文件问题。小文件怎么产生的。如何解决的,小文件多大。
5.datanote挂了怎么办,小文件会造成那些问题
6.数据倾斜的原因有哪些
7.之前工作中遇到过得最困难的问题,提1~2个
8.工作中最有成就感的事情
9.零点漂移问题
10.superset可以设置参数吗
11.用到的工具有哪些。
12.有什么想问的
我在回答小文件的时候有点卡住了,因为我说小文件大小的时候,说小文件大小为16k认为是小文件, 然后面试官问为什么,我说因为mapjoin默认小文件大小是16k,达到256k会进行滚动。
显然不是一个正确的理由。
然后想起来自己说话有点卡顿,但我还是说完了