面试问题记录（RAG方向）

最新推荐文章于 2025-06-30 11:06:16 发布

原创最新推荐文章于 2025-06-30 11:06:16 发布 · 1.3k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#nlp #面试 #gpt

本文讨论了一个项目中采用的大模型，涉及英语和中文语料的处理，结合了BM25和向量检索技术。重点讲解了实体召回、嵌入模型微调、问答模型调整以及LORA原理的应用。同时提到在处理冗余信息和多样抽取目标时的优化策略，以及对NL2SQL的理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

                    
                    简单自我介绍
项目中使用了什么大模型? 语料是英文多还是中文多?
项目中使用了哪种检索方法？

BM25和向量方法如何结合?

使用BM25使用了什么分词器??

有没有针对特定实体进行召回??

还使用了哪些技巧来提升召回的效果??
向量召回时使用的嵌入模型是什么??

有没有对用于向量方法召回的模型进行微调??
有没有对问答模型进行微调?

使用了什么微调方法?

采用了什么手段来提升微调效果??

简要说明LORA的原理??

了解ptuning或其它的微调方法吗??
是否使用了Llamalndex?

没有使用的原因??
进行 信息抽取 时，文本中冗余信息较多，抽取目标种类也很多，这种情况使用大模型进行抽取有哪些优化思路??
是否了解过 NL2SQL?

博客等级

码龄13年

32
原创

216
点赞

270
收藏

110
粉丝

关注

私信

热门文章

分类专栏

上一篇：: RAG学习总结

下一篇：: 面试问题记录（基础&RAG)

最新评论

安装pygraphvis
Azuriksay: windows的换行符是^
安装Stanza(处理Stanza无法下载语言模型的错误：ConnectionError)
Hermit547: 如果下载解压后仍报错显示网络问题，在调用stanza.Pipeline()的时候设置参数download_method=None就行了
Langchain 使用LCEL实现时，如何保留中间数据
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
面试问题记录（LLM）
CSDN-Ada助手: 恭喜您发布了第13篇博客！看到您记录了面试问题（LLM）的内容，实在是非常有用啊！希望您能继续保持创作的热情，分享更多有价值的内容给大家。或许您可以考虑分享一些面试经验或者职场心得，让更多人受益。期待您的下一篇作品！祝您创作顺利！
huggingface下载模型&数据集实践
CSDN-Ada助手: 恭喜您发布了第12篇博客“huggingface下载模型&数据集实践”！文章内容很实用，对于想要学习如何下载模型和数据集的读者来说肯定非常有帮助。希望您能继续保持创作的热情，分享更多有趣的技术实践经验。下一步，建议您可以尝试探讨如何利用这些下载的模型和数据集进行深入的应用和分析，或者分享一些解决实际问题的案例分析，让读者更好地理解和运用所学知识。期待您更多精彩的分享！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。