分享一个大数据的面经

本文作者分享了其在大数据领域的面试经历,包括头条和阿里的多轮技术面试,涉及Hadoop、Spark、YARN、Zookeeper等技术的深入探讨,以及Java、Python基础、数据结构和算法等。面试过程中,作者凭借扎实的技术基础和灵活应对,成功获得意向书。
摘要由CSDN通过智能技术生成

面的公司并不多。拿到了头条和阿里的意向书,如果不出意外应该就是这俩选一个了。

没有实习,没有项目经历,什么都没有,上去就是硬怼。本科不是相关专业,研究生转方向但是是留学生,也不是特别厉害的学校。各方面都比较劣势。

优势就是特别能背。

头条:

一面:面岗位相关的基础,上来面试官直接发现我什么经历都没有,我直接说熟悉hadoop。挑了HDFS让我讲一下。

NN和DN。

HA的实现

zookeeper的原理,zk是如何保证一致性的,zk是如何判断session超时,connection超时的。如何触发回调。

client和HDFS文件的读写过程,延迟太高,怎么解决。我当时脑子一蒙,直接说了设计的就是高吞吐量的文件系统。

yarn的结构,RM和NM的交互,如何分配任务的。

yarn在什么层面调度,和k8s和mesos有什么区别,内存调度是什么怎么调度的,如果考虑CPU怎么调度的。如何实现隔离的,Control group 和Namespace是怎么回事。

手撕算法链表排序

人生中的第一次面试。。。。面的一团糟,多亏面试官使劲高抬贵手。。。

二面:面的计算机基础:

上来手撕,剑指原题,两个栈实现一个队列。

问了一下转专业的经历。

讲个简历的项目。

操作系统中的进程和线程的区别。

JVM的内存模型说一下,堆,栈,永久区,GC。

Java的多线程。

Hadoop的MR和Spark有什么区别,为什么Spark有优势。

TCP

用过什么数据库啊,然后就没往深了问了。

手推神经网络上的反向传播,把链式求导写出来,激活函数sigmoid。

介绍一下LSTM,和GRU的区别。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值