节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。
今天我整理 NLP、搜光推、大模型等算法方向的面试题,分享给大家,希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以加入我们。
技术交流群
前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~
我们建了算法岗技术与面试交流群, 想要进交流群、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2060。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2060,备注:技术交流
飞猪-搜索算法
飞猪-base杭州-搜索算法
-
哈希寻址算法
-
讲一下最短路算法
-
如何判断图中是否有环
-
概率题:99%的概率预测正确,0.3%是真阳,p(真阳|阳)的概率等于多少
-
场景题1:给定当前query和历史query以及对应实体,如何对当前query的实体进行建模
-
场景题2:多语言如何判断是哪个语种,比如马来西亚语和英语有点相似,应该如何判断
-
场景题3:query改写 baseline 评估迭代建模,query改写的作用(比如“北大”“北京大学”哪个与酒店更匹配)
-
场景题4:纠错,相似词建模
-
场景题记不太清楚了,但是和面试官们交流很愉快
百度-算法工程
百度-base上海-算法工程
-
c++智能指针
-
python多进程和多线程
-
垃圾回收机制
-
sql事务
-
讲lora的原理
-
讲gbdt
-
翻译任务一般用啥架构
-
encoder-only, decoder-only, encoder-decoder的区别
-
讲transformer
-
讲flash attention
-
fp32和fp16的区别,混合精度的原理
-
beam search原理,与直接sample的区别
-
对大模型的改进
-
平时用什么框架,机器
-
python协程
-
进程,线程,一个进程里面多线程共享哪些资源
-
程序空间和堆栈
-
为什么docker好用,docker创建容器
-
linux怎么看进程; 怎么结束进程; 怎么实时看一个文件
-
c++虚函数
-
python,flask
-
gil全局锁
-
继续flash attention
-
大模型什么情况需要预训练
-
主流大模型的区别
-
一个数学题:甲乙射击,甲射击n次,乙射击n+1次,射中的概率都是0.5,射中一个得一分,最终乙比甲总分多的概率;
好未来-NLP
好未来-base北京-NLP
-
lora的矩阵怎么初始化?为什么要初始化为全0?
-
gpt源码past_key_value是干啥的
-
gpt onebyone 每一层怎么输入输出
-
输出的分布如果比较稀疏,有个尖尖应该怎么处理
-
讲讲决策树,决策树回归问题怎么做
-
gpt的输出topp是啥
-
kl散度的公式和kl散度与交叉熵的区别
-
强化学习的输入
-
chatgpt的reward model怎么来的,三阶段
-
cart树的分裂准则是啥
-
做题:寻找重复数
-
除了cosin还有哪些算相似度的方法
-
文本embedding方法
-
tfidf公式
-
场景题1:师生多轮对话文本(音频转化),如何把无关信息剔除,比如说老师早上好这种
-
场景题2:偏推荐一点,给学生推荐试题,不希望出现做过的相似题目
海康-多模态大模型
海康-base杭州-多模态大模型
-
大模型对输入数据分词的处理,扩大词表
-
python的多进程,多线程,没有真正意义上的多线程,为什么这么设计
-
新版pytorch并行bn
-
口述算法完全平方数
-
10个模态如何选择和搭模型
-
clip的各种变形
-
常用trick,你的别人都不知道的trick(?)
-
数据不均衡怎么处理
-
单独整不同模态的编码和clip的区别
腾讯-广告算法
腾讯-base未知-广告算法
-
做题:
-
求两个列表的交集,时间复杂度尽可能低,不可以用map和set
-
求一个数在一个列表中的最大数
-
ner模型除了gp还有哪些,gp相比普通ner的优点
-
ner中如何去解决预测错误的问题,比如宝马三系标签是BIBI中的三系
-
什么是线性可分,逻辑斯蒂是线性还是非线性的
-
常用的ctr模型
-
deepfm的fm结构是啥
-
如果输入特征只有一维,做二分类任务,这个特征范围是从0到正无穷大,怎么处理
-
nlp任务有哪些
知乎-搜索算法
知乎-base北京-可能是搜索算法
-
项目
-
职业规划
-
项目中的难点
-
做题-旋转数组求最小值
-
bert的attention
-
优化器
-
知道的loss
-
能不能马上去实习
虾皮-NLP
虾皮-base上海-NLP
-
求target在source里的起始终止位置,target和source都有空格,target空格忽略,source空格要算位置。应该是想考kmp模板
-
多模态一些多流的sota有了解吗
-
bert的结构和loss
-
gpt的结构
-
ner模型的了解
-
针对不同的任务,大模型的指令怎么写
-
没有标签,怎么对商品里的iphone pro max做聚合
得物-推荐算法
得物-base杭州-推荐算法
-
nlogn的排序算法
-
讲讲堆排序
-
动态规划
-
xgb和gbdt的区别
-
lora的优缺点
-
bn
-
random forest和gbdt的区别
-
有100个硬币,AB每次都可以拿1到2个,最后一个拿的人获胜,A用什么策略可以保证最后他获胜
用通俗易懂方式讲解系列
- 用通俗易懂的方式讲解:自然语言处理初学者指南(附1000页的PPT讲解)
- 用通俗易懂的方式讲解:1.6万字全面掌握 BERT
- 用通俗易懂的方式讲解:NLP 这样学习才是正确路线
- 用通俗易懂的方式讲解:28张图全解深度学习知识!
- 用通俗易懂的方式讲解:不用再找了,这就是 NLP 方向最全面试题库
- 用通俗易懂的方式讲解:实体关系抽取入门教程
- 用通俗易懂的方式讲解:灵魂 20 问帮你彻底搞定Transformer
- 用通俗易懂的方式讲解:图解 Transformer 架构
- 用通俗易懂的方式讲解:大模型算法面经指南(附答案)
- 用通俗易懂的方式讲解:十分钟部署清华 ChatGLM-6B,实测效果超预期
- 用通俗易懂的方式讲解:内容讲解+代码案例,轻松掌握大模型应用框架 LangChain
- 用通俗易懂的方式讲解:如何用大语言模型构建一个知识问答系统
- 用通俗易懂的方式讲解:最全的大模型 RAG 技术概览
- 用通俗易懂的方式讲解:利用 LangChain 和 Neo4j 向量索引,构建一个RAG应用程序
- 用通俗易懂的方式讲解:使用 Neo4j 和 LangChain 集成非结构化知识图增强 QA
- 用通俗易懂的方式讲解:面了 5 家知名企业的NLP算法岗(大模型方向),被考倒了。。。。。
- 用通俗易懂的方式讲解:NLP 算法实习岗,对我后续找工作太重要了!。
- 用通俗易懂的方式讲解:理想汽车大模型算法工程师面试,被问的瑟瑟发抖。。。。
- 用通俗易懂的方式讲解:基于 Langchain-Chatchat,我搭建了一个本地知识库问答系统
- 用通俗易懂的方式讲解:面试字节大模型算法岗(实习)
- 用通俗易懂的方式讲解:大模型算法岗(含实习)最走心的总结
- 用通俗易懂的方式讲解:大模型微调方法汇总