之前经历了HR的两轮邮件轰炸之后,终于在今天下午四点如约接到了滴滴面试官的电话=。=献出了本年度校招处女面=。=
1.
自我介绍,大概说一下个人背景和研究方向;
2.神经网络初始每条边训练出来的参数权重如何初始化?(我答的是随机在-1到1之间) 追问为什么不能所有的赋成1? 神经网络训练出来的是全局最优解吗?
3.
LR模型的好处,相对于其他的同类算法来说有什么好处?
LR逻辑回归是分类算法还是回归算法? 还了解其他的分类算法吗(答了有KNN,就开始问knn的问题了) KNN大概的步骤和做法是什么,如果给了数据集和label的话?
在什么情况在用LR比较合适,或者说比其他的算法合适? 逻辑回归和线性回归的区别?
4.
算法-数据结构方面了解的多不多,对什么排序算法有自己比较深的见解(我答了都可以,然后他就出了一道排序的问题) 如果说有一个长度为m的整数数组,有m个整数组成,每个数的取值范围都在0到n3之间(前闭后开,整数间可能会有重合)(我答了桶排序,问了时间复杂度是多少,之后一直在纠结,面试官一直暗示我n3是开区间能不能得到什么启示) 了解的线性时间排序有哪些?(很蠢的回答了堆排序、插入排序,但好像不是,为什么这么蠢。。天哪。。。)
5.
C++的问题,类的虚继承主要解决的是什么问题,举个例子来实现虚继承。好处是什么? 在学校里有没有做过C++或者Python代码量比较大的比赛?
6.简单讲一下参加的Datacastle比赛的具体内容(开始balabala的讲),用的是什么模型,用的是什么库,第一次训练LR的结果有什么用?特征选择调用的feature-selection库的输入和输出是什么(把样本的特征和标注直接用进去),了解其内部实现吗。模型的原理,你怎么知道目前差在什么地方,如何诊断。怎么提升后面的指标,还是真的有办法或者明确的迭代方向。 如何判断一个模型是不是过拟合(假如没有baseline怎么办),交叉验证是怎么做的。
7.对自己未来的规划是什么样的。
8.有没有看关于Hadoop等大数据方面的东西,Spark目前会用吗。 (中间又讨论了一下关于前面的数组问题,最后还是提醒我在n3上做文章,可惜最后没有想出来)
9.滴滴的一个实际问题,有司机的轨迹信息,对于具体的订单来说怎么去精准的确定乘客在哪个位置上车的。(大概说了一下可能会有重复的路径,通过重复点和重复路径去挖掘位置信息,还是司机和乘客在程序内的信息交互等)
总之处女面,表现的不那么尽如人意,也不期望能拿到二面资格(如果拿到了,我撤回=。=)而且在C++和数据结构方面准备的还不够充分,得多刷刷基础和面经,多多加油啊=。=