知乎推荐算法工程师面经分享

前言

曾三次迈进知乎的大门,面试算法工程师岗位。特整理了一些相关问题供大家研究,并附上了一些大佬的建议供大家参考。

面试流程

1、自我介绍

    balabala......

2、介绍下协同过滤

    我大致介绍了下协同过滤的分类,以及每种分类的主要思想以及优缺点。其中提到了LFM,面试官又追问LFM用来解决什么问题,我从降维和回归两个角度来进行解释的。

3、介绍下SVD与MF的区别

    我把SVD++的公式写下来并进行了解释,其主要是考虑了用户的隐式反馈信息。

    后来面试官说问错了,其实是想问一下BiasSVD的思想,还好我写的公式包含BiasSVD的公式,主要是对于用户和项目更细粒度的建模,因为有的用户可能相对仁慈,所以评分普遍偏高;有的用户可能比较严厉,所以评分普遍偏低;同理对于项目也是如此,有的项目天上质量上乘,有的项目天上质量比较差。所以我们需要增加偏置项来捕获细粒度的影响。

4、问简历中发表的CCF-C类论文的细节

    由于项目中涉及graph embedding的东西,所以介绍了下GE;

    由于GE涉及到word2vec的东西,我又说了下word2vec。

    因为word2vec分为了CBOW和Skip-gram模型,后来面试官又问两种模型的适用场景。

    因为我只介绍了其中一个优化技术Negative Sampling,其中把概率公式写了出来,他又让我分享一下另一个优化技术Hierarchical Softmax,大致说了下,就是把多分类任务转化为了多个二分类任务,同时利用哈夫曼树来将词频高的词尽可能出现在里根节点近的地方。

5、了解最近MF与深度学习结合的东西吗

    我说了下何向南老师的神经协同过滤,并谈了下利用深度学习技术做推荐的看法。

6、了解常见的机器学习算法吗,说一下LR

    了解。我从线性回归入手过渡到逻辑回归,他们是对于特征的线性组合,并且假设数据是线性可分的,同时可以通过超平面将之分离,另外介绍了可以通过最大似然来推导出LR。思路跟我之前写过的这篇文章类似《由Logistic Regression所联想到的...》。

7、介绍一下常用的排序算法

    O(n^2):冒泡,选择、插入

    O(nlogn):快速排序、堆排序、归并排序

8、说一下快速排序的过程以及最好和最坏情况

    大致说了一下分而治之的流程...

9、了解JVM么,介绍一下

    不是很了解

10、了解协程么,介绍一下

    不是很了解

11、说一下进程与线程的区别

    进程可以由多个线程组成,另外线程间可以进行资源的共享,进程间不行。cpu调用的是线程。

12、咱做个简单的算法题吧,给定一个有序数组,然后再给个关键字,写一个函数返回其下标

    我想到了二分查找来解决这个问题。

13、常用的数据结构了解哪些,hashmap以及如何解决冲突,红黑树以及平衡搜索树等

    因为我本科以及研究生的技术栈偏.NET,所以用的java不是很多,所以不是很了解hashmap,对于冲突解决可以采用开放定址法等。平衡树了解一些,红黑树不是很了解了。

14、说一下推荐系统常用的召回策略...

15、介绍一下深度学习常用来缓解过拟合的手段(至少5个)...

16、推导逻辑回归的损失函数以及推导梯度更新公式...

17、利用队列来实现栈的功能...

18、比较e^2与2^e的大小...

19、给你一个数组,求一个k值,使得前k个数的方差 + 后面n-k个数的方差最小 ,时间复杂度可以到O(n),给定方差公式:D(X)=E(x^2)-[E(X)]^2...

精选留言

知乎用户zzy:算法工程师真正在公司工作,很多时间可能是花在普通的软件开发上,尤其大数据与后端的开发能力,这些要求掌握的语言一般有Java,go(专门有协程),Scala等等,会写接口,也要求对各种关系型或非关系型数据库进行操作,另外还有分布式计算,建议至少掌握hive,spark(尤其里面的mllib)的常见用法,有余力还有flink。以上这些东西没有算法理论那么难理解,但是得花很多时间去实践,才能较好地掌握。从你的描述看,面试官很可能需要你有这些能力。

知乎用户weicheng:对于偏研究的还是建议找类似于ai lab的研究岗,这种所谓的算法工程师岗位根本不涉及模型的研究,算法岗算法岗应该指的是算法研究岗,而不是什么工程岗,工程自有搞后端的帮忙实现。

知乎用户二东东:面试官提到了机器学习不只是离线训练模型 还要有部署能力 比如说说要熟悉 配置环境 Docker Microservice Kubernetes Cloud Servies(AWS, Azure, etc.) 但是这些经验新手比较难有。

知乎用户LucasX:尽管对于ML岗,刷题、CS基础(例如OS、语言底层细节)还是非常重要的,说实话知乎这个问的算是比较简单的了。现在越来越考硬coding功底了。

知乎用户杨帆:看到很多评论说偏 java,其实并没有偏向任何语言,只是想借语言聊聊数据结构和解决问题的思路,数据结构和算法是基础的基础。至于为什么问 jvm 和协程,其实这些都是很有意思的领域,只是想知道平时是不是学习只限于使用语言了,对于相关的东西也希望有学习兴趣,学习兴趣才是关键。

知乎用户刘译文:个人觉得,在模型部署方面,是一套很成熟的流程,算法工程师的核心竞争力仍然还是自己对算法的理解,对业务的理解。其他的一些知识,完全可以工作中进行补充学习。。知乎这个面试,要求的确实有点高啊。

写在最后

    正如面试官所说,我们要求算法工程师不仅对于机器学习算法需要了如指掌,我们更需要将算法部署到真实环境中,因此不是简单的用python训练个模型就好了,还需要将之部署到服务器上,我们更加注重计算机基础相关的东西,同学你还得加强基础训练啊。希望大家在学好理论的同时,能够把编程基础打好,养成好的习惯,比如每天刷一道算法题,每天看一下相关的知识点等。不积跬步无以至千里。将来该公众号也会定期更新一些算法题来供大家一起学习交流。

    后来站在面试官的角度想了想对于应届生来应聘算法工程师岗位,确实也就只能通过项目经历、实习经历、机器学习理论以及手撕算法来衡量一个应届生的能力,因为你没有实在的工作经验,人家也不会跟你聊偏业务的东西或者工业界独有的东西,所以准备好以上几个方面,相信你肯定可以收获若干个offer的。

更多干货请点击:
2021年3月热门报告盘点(附下载链接)多目标排序在快手短视频推荐中的应用实践.pdf深度学习及在美团推荐中的实践

YouTube深度学习推荐系统的十大工程问题
【内推】美团招聘搜索推荐算法工程师
推荐系统解构.pdf(附下载链接)
2020年十大人工智能进展及2021年十大人工智能趋势
2020年轻人性和爱调查报告.pdf(附下载链接)
关注我们

省时查报告

专业、及时、全面的行研报告库

长按并识别关注

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值