秋招面了几家大厂算法岗( 含NLP、搜光推、大模型方向),复盘面试题来了。。。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。

今天我整理 NLP、搜光推、大模型等算法方向的面试题,分享给大家,希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以加入我们。

技术交流群

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~

我们建了算法岗技术与面试交流群, 想要进交流群、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2060。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。

方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2060,备注:技术交流

飞猪-搜索算法

飞猪-base杭州-搜索算法

  • 哈希寻址算法

  • 讲一下最短路算法

  • 如何判断图中是否有环

  • 概率题:99%的概率预测正确,0.3%是真阳,p(真阳|阳)的概率等于多少

  • 场景题1:给定当前query和历史query以及对应实体,如何对当前query的实体进行建模

  • 场景题2:多语言如何判断是哪个语种,比如马来西亚语和英语有点相似,应该如何判断

  • 场景题3:query改写 baseline 评估迭代建模,query改写的作用(比如“北大”“北京大学”哪个与酒店更匹配)

  • 场景题4:纠错,相似词建模

  • 场景题记不太清楚了,但是和面试官们交流很愉快

百度-算法工程

百度-base上海-算法工程

  • c++智能指针

  • python多进程和多线程

  • 垃圾回收机制

  • sql事务

  • 讲lora的原理

  • 讲gbdt

  • 翻译任务一般用啥架构

  • encoder-only, decoder-only, encoder-decoder的区别

  • 讲transformer

  • 讲flash attention

  • fp32和fp16的区别,混合精度的原理

  • beam search原理,与直接sample的区别

  • 对大模型的改进

  • 平时用什么框架,机器

  • python协程

  • 进程,线程,一个进程里面多线程共享哪些资源

  • 程序空间和堆栈

  • 为什么docker好用,docker创建容器

  • linux怎么看进程; 怎么结束进程; 怎么实时看一个文件

  • c++虚函数

  • python,flask

  • gil全局锁

  • 继续flash attention

  • 大模型什么情况需要预训练

  • 主流大模型的区别

  • 一个数学题:甲乙射击,甲射击n次,乙射击n+1次,射中的概率都是0.5,射中一个得一分,最终乙比甲总分多的概率;

好未来-NLP

好未来-base北京-NLP

  • lora的矩阵怎么初始化?为什么要初始化为全0?

  • gpt源码past_key_value是干啥的

  • gpt onebyone 每一层怎么输入输出

  • 输出的分布如果比较稀疏,有个尖尖应该怎么处理

  • 讲讲决策树,决策树回归问题怎么做

  • gpt的输出topp是啥

  • kl散度的公式和kl散度与交叉熵的区别

  • 强化学习的输入

  • chatgpt的reward model怎么来的,三阶段

  • cart树的分裂准则是啥

  • 做题:寻找重复数

  • 除了cosin还有哪些算相似度的方法

  • 文本embedding方法

  • tfidf公式

  • 场景题1:师生多轮对话文本(音频转化),如何把无关信息剔除,比如说老师早上好这种

  • 场景题2:偏推荐一点,给学生推荐试题,不希望出现做过的相似题目

海康-多模态大模型

海康-base杭州-多模态大模型

  • 大模型对输入数据分词的处理,扩大词表

  • python的多进程,多线程,没有真正意义上的多线程,为什么这么设计

  • 新版pytorch并行bn

  • 口述算法完全平方数

  • 10个模态如何选择和搭模型

  • clip的各种变形

  • 常用trick,你的别人都不知道的trick(?)

  • 数据不均衡怎么处理

  • 单独整不同模态的编码和clip的区别

腾讯-广告算法

腾讯-base未知-广告算法

  • 做题:

  • 求两个列表的交集,时间复杂度尽可能低,不可以用map和set

  • 求一个数在一个列表中的最大数

  • ner模型除了gp还有哪些,gp相比普通ner的优点

  • ner中如何去解决预测错误的问题,比如宝马三系标签是BIBI中的三系

  • 什么是线性可分,逻辑斯蒂是线性还是非线性的

  • 常用的ctr模型

  • deepfm的fm结构是啥

  • 如果输入特征只有一维,做二分类任务,这个特征范围是从0到正无穷大,怎么处理

  • nlp任务有哪些

知乎-搜索算法

知乎-base北京-可能是搜索算法

  • 项目

  • 职业规划

  • 项目中的难点

  • 做题-旋转数组求最小值

  • bert的attention

  • 优化器

  • 知道的loss

  • 能不能马上去实习

虾皮-NLP

虾皮-base上海-NLP

  • 求target在source里的起始终止位置,target和source都有空格,target空格忽略,source空格要算位置。应该是想考kmp模板

  • 多模态一些多流的sota有了解吗

  • bert的结构和loss

  • gpt的结构

  • ner模型的了解

  • 针对不同的任务,大模型的指令怎么写

  • 没有标签,怎么对商品里的iphone pro max做聚合

得物-推荐算法

得物-base杭州-推荐算法

  • nlogn的排序算法

  • 讲讲堆排序

  • 动态规划

  • xgb和gbdt的区别

  • lora的优缺点

  • bn

  • random forest和gbdt的区别

  • 有100个硬币,AB每次都可以拿1到2个,最后一个拿的人获胜,A用什么策略可以保证最后他获胜

用通俗易懂方式讲解系列

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值