先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
问我刷题不?(这想要我什么回答呢),杯子倒水智力题,实习项目聊一聊
======================================================================
难度:normal+
一面
上来怼了我一堆python的东西,我python当脚本用的,说能不能换个方向聊一聊,然后怼了一堆
-
期望
-
准确率召回率
-
AUC和ROC
-
决策树聊一聊
-
阐述自己如何设计模型的
开始问题偏向于算法,后来我说我其实擅长架构类的东西…小姐姐说,这样啊,不过看你答的还可以啊,架构我就不问你了…
二面
问了些数据仓库的问题,雪花型和星型数据库等,我表示一脸懵逼,然后和他扯Spark Streaming,他对这个还挺感兴趣的,算是晃点住了,后面说加班怎么看,然后他开始介绍他NB的团队,我开始瞻仰,膜拜…最后问问能不能来实习,基本回答都是能(不能的好像都没了…),时间节点自己需要把握一下,最好等到所有offer都下来的时候,我自己预估是10月中旬吧
=====================================================================
难度:father
一面
-
spark streaming 怼一波
-
如何保证exactly once
-
tcp中全连接池和半连接池等
-
剑指offer上一道题:二叉树蛇皮走位??
二面
-
yarn 调度算法
-
扯了扯spark streaming
-
一道算法,树中两节点找最亲的爸爸…
-
实习聊一聊
面试官不是很感冒,问我还有什么补充了,我竟然说没…猝,血淋淋的教训啊
=====================================================================
难度:hard
一面
两个面试官,发了张卷子,里面什么题都有:
-
排序、有重复的数组中查询某数的index,注意不要退化成o(N)的算法
-
在一棵树中查找两个节点的最近公共父节点(就是头条二面那道题)
-
linux $$ $# $0 等含义
-
智力题 50红 50黑 分配两袋子摸球问题
-
n!后面有多少个0
-
hdfs的基本操作
-
大数据处理问题,用spark处理下
二面
-
问我为啥不考虑读博?(学的太渣,感觉没有必要读…)
-
问我对前面面试官的看法(你要炒他们吗。。。)
-
实习聊一聊
=====================================================================
难度:normal+
讲道理贝壳我是抱着去打小怪的心态去的,并没打算留下的,但是面试体验很好,最后给的薪水超高、福利也爆炸,缺点的话大家懂得,偏养老,看大家选择吧。算是帮一面的大哥打波广告吧
一面
数据倾斜怎么处理,我个人感觉我回答的比较差,以前没仔细思考过这个问题,后来查了查发现里面有很多道道。
但面试官很nice,问了问我其他方面,感觉还不错,后面和我讨论了30分钟的职业发展问题,感觉来的很值,大哥我能加你微信吗…
二面
比较年轻的高冷小哥面我的
-
Spark架构
-
shuffle过程
-
Spark Streaming 原理
-
一道关于棋盘左上角跑到右下角的问题,从搜索、dp、到数学的方法都讨论了一遍
-
机器学习捎带说了一嘴
-
实习聊了聊
==============================================================================
Java
1.线程并发
Q:进程和线程的区别?
Q:进程间通信方式?
Q:线程间通信方式?
Q:Callable、Runnable区别?
Q:Future和Callable的关系?
Q:创建线程的方法?
Q:volatile关键字的作用?
Q:synchronized的用法?
Q:讲一下Java内存模型?
Q:CountDownLatch和CyclicBarrier了解吗?
Q:Semaphore用法?
Q:ThreadLocal作用?
Q:单例与多例的区别?
Q:锁释放的时机?
Q:notify唤醒时机?
Q:notify和notifyAll区别?
Q:讲一下Lock?
Q:锁的种类?
2.集合
集合相对容易,常规送分题,基本都会问到HashMap
Q:TreeSet特性?
Q:LinkedHashMap特性?
Q:ArrayList与Vector的差别?
Q:LinkedList与ArrayList的差别?
Q:HashMap与HashTable的差别?
Q:Set与List的差别?各自有哪些子类?
Q:hashCode()、equals()、==区别?
Q:Java容器中添加的对象是引用还是值?
Q:Iterator和ListIterator的区别?
Q:HashMap实现?
Q:ConcurrentHashMap和HashTable区别?
3.GC
这块主要介绍JVM内存的划分以及GC算法
Q:什么是内存泄漏和内存溢出?
Q:导致内存溢出的因素?
Q:JVM内存划分?
Q:简单说一下垃圾回收?
Q:Minor GC、Major GC和 Full GC的区别?
Q:Full GC触发时机?
Q:什么是常量池?
4.类加载
面试时有人问到过,回去大概查了下
Q:讲一下类加载过程?
Q:Java初始化顺序?
Q:Java类加载器的种类?
Q:双亲委派模式了解吗?
5.面向对象
这些问题很弱鸡,但考的也比较多
Q:面向对象的三大特性?
Q:Java中接口和抽象类区别?
Q:重载和重写?
6.设计模式
Q:例举一下你了解的设计模式?
Q:手撸单例?
8.网络协议
Q:TCP3次握手4次挥手?
Q:TCP为什么是一定要是3次握手,而不是2次或3次以上?
Q:TCP为什么是4次挥手,而不是3次呢?
Q:TCP半连接池与全连接池?
Q:TCP和UDP的区别?
Q:TCP和UDP的应用?
Q:TCP/IP与OSI模型?
Q:ping命令基于哪种协议?
Q:阻塞式和非阻塞式IO区别?
======================================================================
用数据库做过开发,但是了解的不深入,面试问我会不会写SQL时,我回答“简单的可以,复杂的尝试一下”…SQL复杂起来真不是人写的…
Q:聚集索引和非聚集索引区别?
Q:where、group by、having执行顺序?
Q:星型、雪花结构?
Q:SQL纵向转横向,横向转纵列?
Q:脏读、不可重复读、幻读?
Q:join实现的三种方式?
========================================================================
Q:查看xxx端口占用?
Q:查看xxx进程占用?
Q:查看CPU使用情况?
Q:查看内存使用情况?
Q:查看硬盘使用情况?
Q: 0 、 0、 0、n、KaTeX parse error: Expected ‘EOF’, got ‘#’ at position 1: #̲、*、 @ 、 @、 @、?、$$含义?
Q:>、>>区别?
Q:>、1>、2>、2>&1、2>1区别?
Q:定时任务命令?
=====================================================================
算法的海洋的无边无际,但是应付面试题的算法,个人认为《剑指offer》一本足矣…
个人《剑指offer》刷了大概四遍,基本上看到一道题,所有解法都知道,面试上也基本从这里出我遇到现场出的算法题(除了《剑指offer》上的),一般是暴力搜索题,不要上来想DP…
经典问题
-
子串匹配问题
-
子序列匹配问题
-
合并链表
-
树中两个节点最近的公共父节点
-
快排、堆排
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
务命令?
=====================================================================
算法的海洋的无边无际,但是应付面试题的算法,个人认为《剑指offer》一本足矣…
个人《剑指offer》刷了大概四遍,基本上看到一道题,所有解法都知道,面试上也基本从这里出我遇到现场出的算法题(除了《剑指offer》上的),一般是暴力搜索题,不要上来想DP…
经典问题
-
子串匹配问题
-
子序列匹配问题
-
合并链表
-
树中两个节点最近的公共父节点
-
快排、堆排
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-bmgwr0Zn-1713205497929)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!