一面内容
字节跳动 —— 2023暑期实习面试
时间:2022.3.29 16:00
岗位:Data 数据平台 数据研发
时常:25分钟左右
仅作为1面的复盘
1. 自我介绍(面试官先自我介绍)
2. 为何工作后读研(之前工作行业相对特殊)
3. 何时能开始实习(5月),能实习多久(4个月),面试官说一般是6个月,我说没有问题,多两个月也行
4. Hadoop HA 如何实现的?高可用集群的调度工具是什么?
5. Hadooop宕机了,如何应对这种问题?(采用副本机制)
6. 副本机制是什么?(block按照3份保存,分别放在不同的DN上,当节点A故障,从B和C上读取, ) , 我多说了一句client读取的时候遵循两个原则:就近且可靠, 面试官追问:这里就近是物理距离还是传输,我想了想说是传输(本质是带宽性能,有蒙的嫌疑)
7. 这里突然话锋一转:3副本机制改为2副本机制会有什么影响?(我下意识回答,副本数减少,占用的存储空间也减少,后面想不到,感觉这是一种基于实际工作经验的场景题)
8. 面试官引导,换个问题:本来3副本,现在有两副本,如何把第三个补上(开始我愣了一下,他提醒pipeline知道吗?我才意识