![](https://img-blog.csdnimg.cn/20190918140129601.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
搜广推算法实战&面试
文章平均质量分 90
搜广推算法实战
机器学习社区
这个作者很懒,什么都没留下…
展开
-
面试小红书算法岗,希望这次可以上岸。。。
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天分享一位球友面试小红书算法岗的面经。面试内容:1.自我介绍2.聊项目3.hitrate计算4.双塔模型线上如何检索的5.余弦相似度和欧式距离6.bert模型结构和预训练任务7.ELMO和GPT8.多头注意力中为什么需要W矩阵9.QKV物理意义。原创 2024-05-01 14:46:17 · 710 阅读 · 0 评论 -
面了钉钉搜广增算法岗(暑期实习),秒挂。。。。
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天分享我们社群小伙伴的面经,面了钉钉搜广推方向的算法岗,表示没有好好准备,错失了一次很好的机会,特别后悔。面试题整理一下分享给大家,形式:电话面试时间:2024年4月9日 10:00,总计38分钟。原创 2024-04-09 22:00:41 · 792 阅读 · 0 评论 -
百度机器学习算法春招一二三面面经
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。原创 2024-04-09 21:38:40 · 1032 阅读 · 1 评论 -
面了腾讯 PCG 技术线的推荐算法岗,面试体验很丝滑!
节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天分享一文技术群小伙伴的面经,希望对大家找工作有帮助,大家好,腾讯这次面试体验很丝滑,虽然不知道能不能过,但是面试官给我感觉非常不错,应该是目前体验最好的面试官了!希望能过!原创 2024-04-04 23:51:16 · 474 阅读 · 0 评论 -
《搜广推算法指南》(2024版) 重磅发布!
因篇幅有限,《搜广推算法指南》(2024版)部分目录如下。本次增加了业内推荐系统与大模型相结合的实践案例,增加了最新的搜广推与大模型相结合的面试题,丰富了搜广推的基础理论、编程能力部门,删除了一些过时的内容。原创 2024-04-04 23:33:56 · 2081 阅读 · 0 评论 -
面了美团搜索推荐算法岗,虽然有点难过但收获不少!
总体感觉面试不难,但是处处又都体现着你对这些知识点的理解。而且很重要的一点,要是编程题没做出来的话,大概率面试就凉了,但感觉这次面试学到了不少。原创 2024-02-29 22:25:31 · 974 阅读 · 0 评论 -
面了阿里的搜推算法岗,被问麻了。。。。
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天我整理一文社群粉丝的算法岗方向面试题,分享给大家,希望对后续找工作的有所帮助。原创 2024-02-27 21:34:52 · 956 阅读 · 0 评论 -
汇总版!美团搜索推荐算法面试题10道(含答案)
推荐系统的流程主要包含一下几个阶段。会根据内容特性提前建立若干种类型的索引。用户请求时会从各种索引种取出千/万 条item。针对这上千/万条item,进行第一遍打分,再筛选出几百条或者千条。这个阶段的排序模型一般都比较简单,能够过滤掉一些与用户兴趣明显不相关的。得到几百条item后,精排阶段会建立相对精细的模型,根据用户的画像,偏好,上下文,结合业务目标进行排序。一般精排后返回50-100条给到engine侧。engine 侧拿到精排的50条item。原创 2024-02-27 21:19:27 · 1215 阅读 · 0 评论 -
太卷!太难!24届算法岗秋招面经(搜广推方向)分享!
秋招结束一段时间了,从23年7月开始投递到24年1月最后一场面试,经历了近半年的时间。总的来说23年互联网秋招形式不容乐观,各大厂岗位肉眼可见地减少,难度相对往年也有很大提升。机器学习社区的邀请,分享我的秋招经历,在社区小伙伴的交流中,让我提前懂得了很多,也提供了很多宝贵的面试题。今天我经合自身经验,分享三点:实习真的很重要 我是没打算读博所以实验室的事就做得少一点,挤了时间去实习。每场面试有一大半的时间都在问实习项目,结合一些业务和算法的知识点问而且问得很深。原创 2024-02-26 21:35:08 · 1935 阅读 · 0 评论 -
第三波福利来袭!知名大厂推荐算法岗最新面试题来了!
年底了,技术群组织了一场算法岗技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,之前已分享了两次。原创 2024-02-07 20:30:37 · 1018 阅读 · 0 评论 -
超级汇总!知名大厂推荐算法岗最新面试题都在这里了!
总体感觉面试不难,但是处处又都体现着你对这些知识点的理解。而且很重要的一点,要是编程题没做出来的话,大概率面试就凉了。这次面试学到了不少。原创 2024-02-07 16:23:02 · 989 阅读 · 0 评论 -
太棒了!这是我见过的推荐算法岗(含实习)面试真题最全的总结了!
学校:悉尼新南威尔士大学专业:计算机类岗位:360推荐算法岗(实习)原创 2024-02-07 12:04:51 · 1570 阅读 · 0 评论 -
面了百度推荐算法岗(实习),这次如愿以偿。。。
最近技术群组织了一次算法面试讨论会,今天分享的是一位拿到 OFFER 的小伙子,原创 2024-02-06 21:57:52 · 667 阅读 · 0 评论 -
快手推荐算法工程师三面回顾
快手三次技术面试+一次HR面试的简单回顾,希望对大家有所启发。原创 2024-01-04 22:10:34 · 914 阅读 · 0 评论 -
电影推荐项目实战(双塔模型)
一、推荐的技术方法推荐系统简单来说就是, 高效地达成用户与意向对象的匹配。而技术上实现两者匹配,简单来说有两类方法:【注】文末提供交流群1.1 基于分类方法分类的方法很好理解,预测用户对该类别是否有偏好。可以训练一个意向物品的多分类模型,预测用户偏好哪一类物品。或者将用户+物品等全方面特征作为拼接训练二分类模型,预测为是否偏好(如下经典的CTR模型,以用户物品特征及对应的标签 0或 1 构建分类模型,预测该用户是否会点击这物品,)。基于分类的方法,精度较高,常用于推荐的排序阶段(如原创 2022-03-23 23:54:24 · 3267 阅读 · 1 评论 -
深度盘点:基于双塔结构的推荐模型总结
目前,对于基于向量召回,那就不得不提到双塔。**为什么双塔在工业界这么常用?**双塔上线有多方便,真的是谁用谁知道,user塔做在线serving,item塔离线计算embeding建索引,推到线上即可。下面我就给大家介绍一些来自微软、Facebook、Baidu、YouTube的经典双塔模型。微软双塔DSSM先说双塔模型的鼻祖,这是微软在CIKM2013发表的一篇工作,它主要是用来解决NLP领域语义相似度任务的。Word hashing真的是DSSM的骚操作了,不同于现有的RNN,Bert等模型,原创 2021-11-22 09:15:44 · 1370 阅读 · 0 评论 -
超全,7种经典推荐算法模型及应用
本文调研了推荐系统里的经典推荐算法,结合论文及应用进行分析、归纳并总结成文,既是自己的思考过程,也可当做以后的翻阅手册。前言个性化推荐,是指通过分析、挖掘用户行为,发现用户的个性化需求与兴趣特点,将用户可能感兴趣的信息或商品推荐给用户。本文调研了推荐系统里的经典推荐算法,结合论文及应用进行分析、归纳并总结成文,既是自己的思考过程,也可当做以后的翻阅手册。俗话说学而时习之,人的认识过程是呈螺旋式上升的,特别是理论应用到实践的过程,理论是实践的基础,实践能反过来指导人对理论的认识,我相信在将下文所述的算法应原创 2021-12-30 16:49:02 · 25560 阅读 · 9 评论 -
双塔模型的瓶颈,究竟在哪?
开放域问答系统的泛化性和鲁棒性一直是一个业界难题,其中位于最顶层的稠密检索模型(Dense Retriever)常常被诟病其OOD泛化能力不如传统的BM25算法。今天分享一篇来自Google的工作,其实稠密检索模型的泛化能力并不是天生就差,它只是需要更强大的编码器和更多更好的训练数据而已。Large Dual Encoders Are Generalizable Retrievershttps://arxiv.org/abs/2112.07899干货推荐浙大博士导师深度整理:Ten原创 2022-01-13 15:36:23 · 559 阅读 · 0 评论 -
谈谈 LLM 在推荐域的渗透,探索推荐新范式
搜索慢慢的被大模型渗透,那么很自然很多人想到了推荐,但是推荐是不是真的可以被大模型渗透呢?大模型能改变推荐的范式吗?最近大模型真的很火,从个人到公司,各行各业都在学习大模型、总结大模型和尝试应用大模型。大模型其实不是一个新的产物,已经在NLP发展了很多年。ChatGPT的诞生,经验的效果震惊了所有人,虽然也有一些瑕疵,但是瑕不掩瑜。微软投资OpenAI看到了它的未来。微软快速围绕ChatGPT对相关的产品进行了产品升级,从搜索到微软365各种产品。原创 2023-12-09 09:53:30 · 233 阅读 · 0 评论 -
大语言模型在推荐系统的实践应用
本文从应用视角出发,尝试把大语言模型中的一些长处放在推荐系统中。传统的推荐模型网络参数效果较小(不包括embedding参数),训练和推理的时间、空间开销较小,也能充分利用用户-物品的协同信号。但是它的缺陷是只能利用数据集内的知识,难以应用open domain 的知识,缺乏此类语义信息和深度推理的能力。大语言模型从这几个角度来看,正好跟推荐模型有一定取长补短的能力。它能够引入外部知识,能够有跨域的能力,但是它没有推荐场景下所需要的协同信号,另外它的计算成本(不管是训练还是推理)都非常高。原创 2023-10-17 22:46:40 · 909 阅读 · 0 评论 -
业界总结 | 如何改进双塔模型,才能更好的提升你的算法效果?
关注对白,与我一起悄悄拔尖,惊艳所有大家好,我是对白。今天写点技术干货来回馈一下我的粉丝们。本来想继续写对比学习(Contrastive Learing)相关类型的文章,以满足我出一本AI前沿技术书籍的梦想,但奈何NIPS2021接收的论文一直未公开,在arxiv上不停地刷,也只翻到了零碎的几篇。于是,我想到该写一下双塔模型了,刚进美团的第一个月我就用到了Sentence-BERT。为什么呢?因为双塔模型在NLP和搜广推中的应用实在太广泛了。不管是校招社招,面试NLP或推荐算法岗,这已经是必问的知识点了。接原创 2021-11-22 09:34:39 · 568 阅读 · 0 评论 -
推荐算法实战项目:FNN 原理以及案例实战(附完整 Python 代码)
用户行为预测在许多网页级应用上发挥着重要的作用,比如网页搜索、推荐系统、赞助搜索、以及广告展示等。在在线广告中,举个例子,对目标用户群体的定位能力是区别于传统线下广告的关键优势。所有的定位技术,都依赖于预测是否特定的用户认为这个广告是相关的,给出用户在特定的场景中点击的概率。目前大部分的CTR预测都是线性模型,如逻辑回归,朴素贝叶斯,FTRL逻辑回归和贝叶斯逻辑回归等。所有的这些都是基于使用one-hot编码的大量稀疏特征。线性模型简单,有效,但是性能偏差,因为无法学习到特征之间的相互关系。原创 2023-05-04 00:51:56 · 2186 阅读 · 0 评论 -
推荐算法实战项目:AFM 原理以及案例实战(附完整 Python 代码)
本文要介绍的是由浙江大学联合新加坡国立大学提出的AFM模型。通过名字也可以看出,此模型又是基于FM模型的改进,其中A代表”Attention“,即AFM模型实际上是在FM模型中引入了注意力机制改进得来的。之所以要在FM模型中引入注意力机制,是因为传统的FM模型对所有的交叉特征都平等对待,即每个交叉特征的权重都是相同的(都为1)。而在实际应用中,不同交叉特征的重要程度往往是不一样的。如果”一视同仁“地对待所有的交叉特征,不考虑不同特征对结果的影响程度,事实上消解了大量有价值的信息。原创 2023-05-04 00:42:13 · 1093 阅读 · 0 评论 -
推荐算法实战项目:NFM 原理以及案例实战(附完整 Python 代码)
本文要介绍的是由新加坡国立大学的研究人员在论文中提出的NFM模型。NFM模型全称是Neural Factorization Machines,通过名字也可以看出,这又是一个基于FM模型改进得到的网络。无论是FM模型还是其改进模型FFM,归根结底是一个二阶特征交叉的模型。受到组合爆炸问题的困扰,FM几乎不可能扩展到三阶及其以上,这就不可避免地限制了FM模型的表达能力。而深度学习网络理论上有拟合任何复杂函数的能力,因此有没有可能使用DNN的更强的表达能力来对FM模型进行扩展呢?这也正是NFM模型出现的缘由。原创 2023-05-04 00:32:01 · 1075 阅读 · 0 评论 -
推荐算法实战项目:DeepFM 原理以及案例实战(附完整 Python 代码)
在推荐系统中,学习隐藏在用户行为数据背后的复杂特征交互对最大化CTR任务起着重要的作用,而提高CTR的预估准确率能够直接为企业带来丰厚的利益。很多在线广告系统是根据CTR*bid来对候选广告进行排名的,其中bid代表用户每次点击广告时系统能获得的收益。学习用户点击行为背后的隐藏特征交互对CTR预估任务来说十分重要。作者通过对主流的app应用市场调查研究发现,用户常常在用餐时间下载外卖类app,这就是一种对”app类别“和“时间”这两种特征的二阶交互信息,这类的二阶交互信息可以用于CTR预估任务。原创 2023-05-04 00:23:50 · 3424 阅读 · 0 评论 -
推荐算法实战项目:Deep&Cross 原理以及案例实战(附完整 Python 代码)
点击率(CTR)预估任务是一个大规模的问题,尤其是对于价值数百亿美元的在线广告业务。在广告界,广告商向发布商付款,以便在发布商的网站上展示其广告。较为主流的付款方式是根据每次点击付款(cost-per-click),即当用户点击了一次广告之后,发布商就可以向广告商索取费用。因此,对于发布商而言,其预测广告点击率的能力直接决定了其营收。做出较为准确的点击率预测的关键是要识别出经常预测的特征,并且同时挖掘出不常见的交叉特征信息。原创 2023-05-03 23:58:40 · 984 阅读 · 0 评论 -
推荐算法实战项目:PNN 原理以及案例实战(附完整 Python 代码)
本文要介绍的是由上海交通大学的研究人员提出的PNN(Product-based Neural Networks)模型,该模型包含一个embedding层来学习类别数据的分布式表示,此外还包含product层来捕获字段之间的特征交互模式,最后包含一个全连接层去挖掘更高阶的特征交互。相比Deep Crossing模型,PNN模型在输入、EMbedding层、多层神经网络、以及最终的输出层并没有什么结构上的不同,唯一的区别在于PNN引入了Product(乘积)层来代替了Deep Crossing中的Stack层,原创 2023-05-02 23:13:23 · 1943 阅读 · 0 评论 -
推荐算法实战项目:DCN 原理以及案例实战(附完整 Python 代码)
点击率(CTR)预估任务是一个大规模的问题,尤其是对于价值数百亿美元的在线广告业务。在广告界,广告商向发布商付款,以便在发布商的网站上展示其广告。较为主流的付款方式是根据每次点击付款(cost-per-click),即当用户点击了一次广告之后,发布商就可以向广告商索取费用。因此,对于发布商而言,其预测广告点击率的能力直接决定了其营收。做出较为准确的点击率预测的关键是要识别出经常预测的特征,并且同时挖掘出不常见的交叉特征信息。原创 2023-05-02 09:02:29 · 1919 阅读 · 0 评论 -
推荐算法实战项目:Wide&Deep原理以及案例实战(附完整 Python 代码)
本文要介绍的是Google于2016年提出的Wide&Deep模型,此模型的提出对业界产生了非常大的影响,不仅其本身成功地应用在多家一线互联网公司,而且其后续的改进工作也一直延续至今。Wide&Deep模型正如其名,分别包含了Wide部分和Deep部分。其中Wide部分的作用是让模型具有较强的“记忆能力”(memorization);而Deep部分的作用是让模型具有“泛化能力”(generalization)。原创 2023-05-02 08:49:57 · 2126 阅读 · 1 评论 -
推荐算法实战项目:Deep Crossing 模型原理以及案例实战(附完整 Python 代码)
首先给出Deep Crossing的整体模型架构图,如下:Deep Crossing模型架构图模型的输入是一系列的独立特征,模型总共包含4层,分别是Embedding层、Stacking层、Residual Unit层、Scoring层,模型的输出是用户点击率预测值。注意上图中红色方框部分,输入特征没有经过Embedding层就直接连接到了Stacking层了。这是因为输入特征可能是稠密的也可能是稀疏的,论文中指出,对于维度小于256的特征直接连接到Stacking层。原创 2023-05-01 23:34:47 · 1399 阅读 · 0 评论 -
推荐算法实战项目:AutoRec模型原理以及案例实战(附完整 Python 代码)
本文会介绍AutoRec模型的基本原理,包括网络模型、损失函数、推荐过程、实验结果等,并且会给出基于PyTorch的代码。技术要学会分享、交流,不建议闭门造车。一个人走的很快、一堆人可以走的更远。文章中的完整源码、资料、数据、技术交流提升, 均可加知识星球交流群获取,群友已超过2000人,添加时切记的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。方式①、添加微信号:mlc2060,备注:来自 获取推荐资料方式②、微信搜索公众号:机器学习社区,后台回复:推荐资料。原创 2023-05-01 23:06:56 · 1280 阅读 · 0 评论 -
推荐算法实战项目:LFM隐语义模型原理以及案例实战(附完整 Python 代码)
协同过滤(collaborative filtering)是一种在推荐系统中广泛使用的技术。该技术通过分析用户或者事物之间的相似性,来预测用户可能感兴趣的内容并将此内容推荐给用户。这里的相似性可以是人口特征的相似性,也可以是历史浏览内容的相似性,还可以是个人通过一定机制给与某个事物的回应。比如,A和B是无话不谈的好朋友,并且都喜欢看电影,那么协同过滤会认为A和B的相似度很高,会将A喜欢但是B没有关注的电影推荐给B,反之亦然。本文主要讲述基于矩阵分解的隐语义(LFM)模型算法的原理以及代码实现。原创 2023-05-01 22:40:23 · 1421 阅读 · 0 评论 -
推荐算法实战项目:物品协同过滤算法(ItemCF)原理以及案例实战(附完整 Python 代码)
协同过滤(collaborative filtering)是一种在推荐系统中广泛使用的技术。该技术通过分析用户或者事物之间的相似性,来预测用户可能感兴趣的内容并将此内容推荐给用户。这里的相似性可以是人口特征的相似性,也可以是历史浏览内容的相似性,还可以是个人通过一定机制给与某个事物的回应。比如,A和B是无话不谈的好朋友,并且都喜欢看电影,那么协同过滤会认为A和B的相似度很高,会将A喜欢但是B没有关注的电影推荐给B,反之亦然。原创 2023-05-01 22:26:27 · 7666 阅读 · 6 评论 -
推荐算法实战项目:用户协同过滤(UserCF)原理以及案例实战(附完整 Python 代码)
协同过滤(collaborative filtering)是一种在推荐系统中广泛使用的技术。该技术通过分析用户或者事物之间的相似性,来预测用户可能感兴趣的内容并将此内容推荐给用户。这里的相似性可以是人口特征的相似性,也可以是历史浏览内容的相似性,还可以是个人通过一定机制给与某个事物的回应。比如,A和B是无话不谈的好朋友,并且都喜欢看电影,那么协同过滤会认为A和B的相似度很高,会将A喜欢但是B没有关注的电影推荐给B,反之亦然。本文主要讲述基于用户协同过滤算法的原理以及代码实现。原创 2023-05-01 22:09:47 · 7105 阅读 · 2 评论