大模型面经 - 通义实验室

小森__

于 2025-03-03 20:23:37 发布

阅读量287

点赞数 2

分类专栏：大模型面经文章标签： nlp 深度学习面试求职招聘经验分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45768638/article/details/145998393

版权

大模型面经专栏收录该内容

5 篇文章

订阅专栏

在这里插入图片描述

部门与岗位：阿里集团 - 通义实验室 - 大语言模型

一面

首先自我介绍和过项目，因为之前在阿里系实习，用过 Qwen 做业务，面试官就很感兴趣，问为什么选 Qwen，Qwen 落地的实际效果怎么样等等
Qwen 的模型结构是怎么样的，相比于 LLaMA，DeepSeek 有什么区别
对于超长上下文业界一般是怎么做的，你知道 Qwen 是怎么做的吗
大模型的 MoE 结构相比于 Dense 结构训练的难点在什么地方，DeepSeekMoE 为什么效果好，有什么值得我们借鉴创新点
怎么缓解大模型的幻觉问题
讲一下 RLHF 的流程，PPO 和 DPO 算法是什么思想，写一下 PPO 和 DPO 的 Loss 表达式
代码：Transformer Encoder
代码：152. 乘积最大子数组

一面整体难度我感觉还是比较大的，考察的内容更加注重对大模型整体的理解，面的时间也比较久，通义 bar 还是高呀

二面

自我介绍和过项目，项目这里还是类似的，问 Qwen，为什么用 Qwen，相比于其他开源模型好在哪里
除了 Qwen 还了解哪些模型，LLaMA、DeepSeek、GLM……
你觉得 DeepSeek 做的好的有哪几个点，讲讲 DeepSeekMoE 和 MLA
说一下 LoRA 是什么原理
了解 DeepSpeed 吗，ZeRO-1，ZeRO-2 和 ZeRO-3 分别做了哪些优化
知道 FP16 和 BF16 有什么区别吗，包括 FP32 和 INT8 这些，在训练大模型的时候，应该怎么选择
除了 DeepSpeed，在训练和推理的时候，显存不足还有什么优化方法吗，FlashAttention 具体是怎么做的
代码：200. 岛屿数量

二面问的模型结构方面的内容比较少，更多的是训练推理优化方面的内容，更偏底层一些。从 DeepSeek 的动向来看，降低大模型的时间复杂度和空间复杂度应该也是接下来一段时间的重点

三面

自我介绍，过项目，还是重点问了 Qwen，在过程中还一起讨论了当前做法的优缺点，是否调研过其他方案等
开放题：站在你的视角，Qwen目前还存在哪些问题
开放题：你觉得目前大模型的上限在哪里
假如给你发了 Offer，会来吗

三面还是常规的大老板面，相对气氛比较轻松，会更加看重自己对于大模型的思考

总结

整体面下来感觉难度还是蛮大的，几乎各个方面都被考察到了，通义目前应该算是阿里系 bar 最高的一个部门了吧，之前面达摩院压力都没有这么大

博客等级

码龄6年

14
原创

64
点赞

146
收藏

47
粉丝

关注

私信

热门文章

分类专栏

最新评论

CentOS7服务器配置CUDA, cuDNN, python3, PaddlePaddle, PaddleDetection
CSDN-Ada助手: 非常感谢CSDN博主分享的这篇博客，让我们了解到如何在CentOS7服务器上配置CUDA、cuDNN、python3、PaddlePaddle、PaddleDetection等技术。我觉得下一篇博客可以继续深入探讨PaddlePaddle和PaddleDetection的使用及优化，尤其是在实际场景中的应用。这样的技术文章对其他用户也会非常有帮助，相信会有更多读者受益于此。期待您的下一篇精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
深度神经网络DNN（四）——手写数字识别
Diana_F: 还可以再分享一次网盘链接吗大佬
深度神经网络DNN（四）——手写数字识别
压垮草的骆驼: sample_weight.pkl过期了，请重新发一下
深度神经网络DNN（四）——手写数字识别
压垮草的骆驼: sample_weight.pkl过期了，请重新发一下
深度神经网络DNN（四）——手写数字识别
qq_41464565: 有完整的代码可以发一份嘛？谢谢。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。