最新的进展,好未来提前批过了哈哈,说好了8月中旬出结果就真的等来了,也希望正在找工作的小伙伴都能拿到想要的offer,对于京东,估计还得在池子里泡泡哈哈。
过去一个多月投了不少简历,不过有回应的就5、6个,深感找工作的不易,不过一个月来也算有一些小的结果,所以心里还算镇定,不过希望大家也不要慌,好好沉淀,最后都会有的。我主要是找的算法方面的工作,方向有涉及强化学习、图之类的,项目中也用到了,所以面经主要会比较多关于这方面的问题。
字节(已意向书)
字节7月1号投的,一共面了6次,第一个部门到第二面的时候挂了,后面把我捞起来了,又换了个部门面了4面,非常感谢字节不断给机会,最后成功拿到意向书了,很开心,能有个好的结果。
一面
1、自我介绍
2、介绍强化学习的项目(背景、动机、如何建模、输入输出和训练算法说了一遍,说完后面试官问了一些细节)
3、说一下DQN吧(先说了q-learning,然后说了DQN的三点改进,以及存在的问题)
4、说一下MC和TD的区别
4、说一下value-based和policy-based的优缺点
5、说一下SAC(这个说的不太好,原理、policy的训练、q网络的训练说的不太清楚,面试当时还没仔细学到这个算法)
6、说一下GBDT(这里只说了一下目标函数比较简略)
算法题
一道概率题:三个盒子分别放的球为:“红 红”,“红 蓝”, “蓝 蓝”,第一次取出一个红球后,取出两个红球且为第一个盒子的概率(第一次遇到考概率题的情况,还算错了)
给定一个n*n的字符盘,和一个字符串,看该字符串是否出现在字符盘中(这个还行,写出来了)
二面
1、自我接受,之后让介绍项目,项目完了就开始问强化学习
2、AC算法的V网络和Q网络的目标函数
3、TD3和DDPG的区别
4、DQN和Sarsa的区别
5、reforcement的目标和梯度是什么
6、探索的epsilon固定不变的时候,DQN什么情况下学不到东西,举例子说明(说了一堆没答到点上,当时确实不知道)
7、什么情况下,SARSE学的比DQN好,举例子说明(这个也没答好)
8、前两个问题面试官看我不知道就不问了,接着他