绝望中迎来曙光,阿里大模型算法岗 Offer 突然来了!

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对大模型技术趋势、算法项目落地经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

总结链接如下:

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们星球


个人情况:浙大研究生在读,游走在ZJU、Alibaba、miHoYo 的菜鸟

阿里通义这边总体战线还是挺长的,虽然早就面试完了,但是在 HR 排序部分耽搁了很久,可能确实有太多优秀的候选人了吧

本来以为已经没啥希望了,今天却突然收到了offer邮件,整个找暑期实习的过程也可以宣告结束了,后面也要开始好好准备秋招啦。

应星主邀请,我把面试题进行了回忆整理,可能有部分残缺,分享出来供大家参考学习,欢迎与我交流学习。

面试题

  1. 讲一下 Transformer 大概架构
  2. 分别讲讲 encoder-only、decoder-only、encoder-decoder不同架构在实际应用的使用场景。
  3. llama2 网络架构?使用了哪些注意力机制?
  4. 手写实现下分组注意力。
  5. llama2的位置编码了解吗? 讲讲几种位置编码的异同
  6. 了解langchain吗? 讲讲主要结构和主要组件,处理复杂任务链时有哪些优势。
  7. 用过微调技术吗,具体讲讲 p-tuning、lora 等微调方法,这些方法与传统fine-tuning微调有何不同。
  8. 模型出现幻觉时,一般怎么解决的
  9. 显存不够时,一般怎么解决的,有哪些常见的优化方法?
  10. 几种主流大模型的 loss了解过吗? 有哪些异同?
  11. 了解半精度训练吗? 展开讲讲原理和优点,在实际应用中有哪些挑战。
  12. deepspeed 用过吗? 分布式训练中如何提升效率。
  13. leetcode 题:合并K个升序链表

面试总结

  1. 当前大模型岗位更加强调实践,如果没有做过大模型的项目且没有针对性准备过,很难回答上。
  2. 大模型微调是很多公司的考察重点。
  3. 几种模型的注意力机制、位置编码要熟悉。
  4. RLHF 的几步多熟悉熟悉

技术交流&资料

技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了算法面试和技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流

通俗易懂讲解大模型系列

  • 13
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值