记搜狗机器学习实习生面试

1.面试经过
面试两点开始,面试的工作人员拿来我的简历挑着上面的算法开始问,首先问到的是决策树算法,我回答到了熵,信息增益,特征选择以及决策树算法的几个步骤,接着他问我决策树如何剪枝,我回答了在训练的时候可以设置它的深度,他接着问如果树已经训练好了,该怎么剪枝,这个我不太明确,当时就扯了一下,说用交叉验证来比较一下没有修剪的决策树与剪掉部分叶子节点的决策树的预测精确率和召回率来确定该剪掉哪些叶子节点;
然后就进入下一个算法了,他看到我的简历上有一个用贝叶斯做文本分类的项目,就让我谈一下贝叶斯算法,我首先说了一下贝叶斯算法的基本理论,怎么指导着文本分类的,接着谈了一下自己做文本分类的流程,感觉答的还不错。然后问了为什么选择贝叶斯做文本分类,分类算法不是有很多吗?你觉得用贝叶斯做这个的优点是什么,为什么不选用别的算法。。。蒙圈。。。
下一个算法是SVM,让我说一下SVM,推一下目标函数。
随机森林,解释一下随机森林是怎么个原理,然后针对自己简历上的一个项目怎么进行特征提取,当时就回答了两点:1.有专门的人进行特征筛选 2.根据随机森林预测的模型中的每个特征贡献值的大小进行特征提取,分别提取前100或200的特征,然后再跑,比较。
最后问了一下神经网络的前向传播和反向反馈。
关于机器学习算法,总体来说不难,因为没有问得特别深,感觉机器学习目前公司要求的水平还是侧重于简单原理的理解,感觉更重要的是特征工程和每个算法的使用场景的差异。
算法问完了,之后就是编程了,对于两年没有刷过题的自己来说简直想说:不要,不要过来。。。第一道算法题是给一个m*n的0,1矩阵,让找出里面最大的全1矩阵,说完题目,他就出去了,好吧,我不会,想了几分钟,感觉暴力的方法肯定时间复杂度达不到他的要求,怎么做了,我拿出了手机开始搜,果然有,不过人家的代码我看不懂啊,心累,想放弃了,心里斗争了好久,继续看人家的代码,看不懂。过了好一会儿,他进来了,看见我查手机了,我坦白告诉他我不会,然后他给我换了一道简单一点的题,链表转置,我刚开始的思路是用到了数据结构-栈,结构他说不需要额外占用存储空间或者占用很少的存储空间,然后我想了半天,发现可以定义两个变量就行,告诉他思路,他让把代码写出来,写出来了。只想说,编程题占用时间太久,对于编程,我真的是菜鸟。
最后他打印了两张试卷,第一张是选择题,第二张是一个大题,他说他来得有点晚,时间不够用,然后就只让我做最后的那个大题。题目是这样的:提供1000首歌曲,并且这些歌曲在豆瓣上都有相应的评分,让你根据评分来设计一个随机算法让评分高的音乐抽到的概率大(概率与评分对应)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值