精选30个大模型高频面试题

大模型与自然语言处理

已于 2024-04-25 23:49:15 修改

阅读量812

点赞数 21

分类专栏： NLP与大模型文章标签： transformer 深度学习人工智能算法自然语言处理大模型面试题

于 2024-04-25 23:45:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75499313/article/details/138202880

版权

NLP与大模型专栏收录该内容

140 篇文章 64 订阅

订阅专栏

本文汇总了30个大模型面试高频问题，涵盖postlayernorm与prelayernorm的区别、思维链技术、ReAct的优点、量化方法、LLM预训练步骤等。通过通俗易懂的方式讲解，适合NLP初学者和面试者参考，包括模型应用、知识图谱增强和算法面试经验分享。

摘要由CSDN通过智能技术生成

我精选30个大模型高频面试题，分享给大家

介绍一下postlayernorm和prelayernorm的区别
什么是思维链（CoT）提示？
你觉得什么样的任务或领域适合用思维链提示？
你了解ReAct吗，它有什么优点？
解释一下langchainAgent的概念
langchain有哪些替代方案？
langchaintoken计数有什么问题？如何解决？
LLM预训练阶段有哪几个关键步骤？
RLHF模型为什么会表现比SFT更好？
参数高效的微调（PEFT）有哪些方法？
LORA微调相比于微调适配器或前缀微调有什么优势？
有了解过什么是稀疏微调吗？
训练后量化（PTQ）和量化感知训练（QAT）与什么区别？
LLMs中，量化权重和量化激活的区别是什么？
AWQ量化的步骤是什么？
介绍一下GPipe推理框架
矩阵乘法如何做张量并行？
请简述下PPO算法流程，它跟TRPO的区别是什么？
什么是检索增强生成（RAG）？
自前主流的中文向量模型有哪些？
为什么LLM的知识更新很困难？
RAG和微调的区别是什么？
大模型一般评测方法及基准是什么？
什么是KVCache技米，它真体是如何实现的？
DeepSpeed推理对算子融合做了哪些优化？
简述一下FlashAttention的原理
MHA，GQA，MQA三种注意力机制的区别是什么？
请介绍一下微软的ZeRO优化器
PagedAttention的原理是什么，解决了LLM中的什么问题？
什么是投机采样技术，请举例说明？

用通俗易懂方式讲解系列

大模型与自然语言处理

关注

21
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
精选30个大模型高频面试题

我精选30个大模型高频面试题，分享给大家。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。