节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学.
针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。
汇总合集:《大模型面试宝典》(2024版) 发布!
项目没怎么问,重点是八股和coding。
整体感受:面试造火箭,实习拧螺丝系列,问的知识特别广猜测和当前组里做的方向密切相关。
八股:
-
偏好数据如何构建以及如何评估这个偏好?
-
为什么一定要用偏好对齐不用sft?你认为偏好对齐和sft区别在哪里?各自优缺点是什么?
-
你觉得RAG和长上下文的区别在哪里?各自有什么优势?
-
介绍一下当前的RAG做法?
-
如何实现长上下文?
-
因为提到了位置编码,所以问解释一下rope和alibi的原理
-
你知道rope里面那个超参可以调整外推吗?有什么效果?
-
lama3和llama2的区别?
-
在微调阶段,如果出现了训练不稳定怎么办?比如出现了抖动,loss突然增大怎么办?
-
了解推理加速方法吗?
-
讲一下 kv_cache 和投机采样?
-
kv_cache 仔细讲一下有什么效果?比如 kv_cache 一次存几个?
代码
- hot 100 hard 二叉树最大路径,在Hot100翻车了,没写出来。
- 升序数组构建平衡二叉搜索树。
- 中序遍历。
反问阶段
- 实习生工作,因为会找很多实习生,做的方向也会有差异,分方向的话:
- 业务方向:做角色扮演的微调,不同风格交给不同人来做尝试。
- 科研方向:自研大模型,做基座大模型以及做推理加速研究。
技术交流群
前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~
我们建了算法岗技术与面试交流群, 想要获取最新面试题、了解最新面试动态的、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2040。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:技术交流