六面字节,四面京东,三面好未来,每面都有算法重不重要你说的算

本文作者分享了其在字节跳动、京东和好未来的算法面试经历,包括强化学习、图算法、概率题、二叉树、动态规划等面试常见问题,以及GBDT、SAC、DQN等算法的理解和应用。同时,提到了面试中遇到的挑战和学习资源。
摘要由CSDN通过智能技术生成

最新的进展,好未来提前批过了哈哈,说好了8月中旬出结果就真的等来了,也希望正在找工作的小伙伴都能拿到想要的offer,对于京东,估计还得在池子里泡泡哈哈。

image

过去一个多月投了不少简历,不过有回应的就5、6个,深感找工作的不易,不过一个月来也算有一些小的结果,所以心里还算镇定,不过希望大家也不要慌,好好沉淀,最后都会有的。我主要是找的算法方面的工作,方向有涉及强化学习、图之类的,项目中也用到了,所以面经主要会比较多关于这方面的问题。

字节(已意向书)

image

字节7月1号投的,一共面了6次,第一个部门到第二面的时候挂了,后面把我捞起来了,又换了个部门面了4面,非常感谢字节不断给机会,最后成功拿到意向书了,很开心,能有个好的结果。

一面

1、自我介绍

2、介绍强化学习的项目(背景、动机、如何建模、输入输出和训练算法说了一遍,说完后面试官问了一些细节)

3、说一下DQN吧(先说了q-learning,然后说了DQN的三点改进,以及存在的问题)

4、说一下MC和TD的区别

4、说一下value-based和policy-based的优缺点

5、说一下SAC(这个说的不太好,原理、policy的训练、q网络的训练说的不太清楚,面试当时还没仔细学到这个算法)

6、说一下GBDT(这里只说了一下目标函数比较简略)

算法题

一道概率题:三个盒子分别放的球为:“红 红”,“红 蓝”, “蓝 蓝”,第一次取出一个红球后,取出两个红球且为第一个盒子的概率(第一次遇到考概率题的情况,还算错了)

给定一个n*n的字符盘,和一个字符串,看该字符串是否出现在字符盘中(这个还行,写出来了)

二面

1、自我接受,之后让介绍项目,项目完了就开始问强化学习

2、AC算法的V网络和Q网络的目标函数

3、TD3和DDPG的区别

4、DQN和Sarsa的区别

5、reforcement的目标和梯度是什么

6、探索的epsilon固定不变的时候,DQN什么情况下学不到东西,举例子说明(说了一堆没答到点上,当时确实不知道)

7、什么情况下,SARSE学的比DQN好,举例子说明(这个也没答好)

8、前两个问题面试官看我不知道就不问了,接着他

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值