目录
面试案例1
一面
聊论文,跟腾讯提前批电面过程差不多,主要是我在说,没深入太多问题。
我主要针对序列数据建模,问了我Markov和RNN的区别。
编程题:很简单的题目,字符串出现第k多的字符,leetcode上原题,写的挺快,问我复杂度就简单分析了一下。
感觉阿里一面面试官比我还谨慎是为啥,感觉没聊多少就结束了。二面紧接着第二天就来了。
二面
一样听我聊论文,没深入太多细节。
问我是怎么训练论文里的RNN的,不收敛怎么办,答分训练误差测试误差,顺便说了欠拟合过拟合的应对方式,以及我模型是怎么确定层数和hidden size的,以及用了哪些防过拟合手段。
问了一个实际场景,用户输入一个坐标,怎么推送给他合适的POI。问题描述的有点不清楚,我理解的也有点懵。先说根据用户特征、相似和社交关系等做个性化推送。又说如果训练数据中用户信息不是完全标注好的,就是半监督问题,可先对POI聚类或者embedding等。
我提到半监督,又进一步问,在标注POI时候,如果坐标信息都是不精确的,离散的,每个用户标注的语义也是多种多样的,怎么处理。答坐标可以把小范围聚集在一起的当作一个POI,标注的时候,用户打的标签数目有限可以投票、标注的内容较多分词后用层次聚类、主题模型之类的办法,给POI打