点击上方蓝字,订阅关注我们!
前言
感谢一番星汇总本次的面试经验,给出了部分面试问题的答案,希望更多人能从中收益,不断积累经验,在面试中优异表现,斩获更多大厂offer,成为offer收割机!
也欢迎更多的人联系我投稿,让更多人学习到你的经验与建议。
阿里菜鸟(机器学习)-1 面-电话面试
1.如何在海量数据(向量维度很高)中查找给定部分数据最相似的top200向量?
A: 由于之前了解过其他面试蚂蚁金服的朋友,也有问到这个题目的,所以反应比较快,直接就说可以用KD树、聚类、hash。
由于一天之内两次连续面试,问了很多机器学习算法的东西。比如:
-
(1)为什么LR需要归一化或者取对数?
-
(2)为什么LR把特征离散化之后效果更好?
-
(3)为什么把特征组合之后还能提升这一些问题。
反正这些基本都是增强了特征的表达能力,或者更容易线性可分吧。
2.SVM原问题和对偶问题关系?
A:
首先明白为什么要引入对偶问题:
(1)容易求解;
(2)核函数。
拉格朗日对偶没有改变最优解,但是改变了算法复杂度:原问题,样本维度;对偶问题,样本数量;所以线性分类 & 样本维度 < 样本数量:原问题求解(liblinear默认)。
非线性,升维:一般导致样本维度 > 样本数量:对偶问题求解
然后就是为什么要引入对偶算法:
(1)对偶问题往往更加容易求解(结合拉格朗日和KKT条件)
(2)可以很自然的饮用很函数(拉格朗日表达式里面有内积,而核函数也是通过内积进行映射的)
3.KKT条件有哪些,完整描述下?
4.LR为什么用 sigmoid函数,这个函数有什么优点和缺点?为什么不用其他函数?
A: 一图便知晓
5.L1正则化为什么可以把系数压缩成0,坐标下降法的具体实现细节?
京东广告数据部(机器学习)-1面-电话面试
1.说一下进程和线程?
2.线程安全的理解?
3.有哪些线程安全的函数?
A: 一图便知晓
4.数据库中的主键、索引和外键,以及作用?
A: 一个表可以没有主键,可以有索引
定义:
-
主键主键:唯一标识一条记录,不能有重复的,不允许为空唯一标识一条记录,不能有重复的,不允许为空;
-
外键外键:表的外键是另一表的主键表的外键是另一表的主键, 外键可以有重复的外键可以有重复的, 可以是空值可以是空值;
-
索引索引:该字段没有重复值,但可以有一个空值该字段没有重复值,但可以有一个空值
作用:
-
主键主键:用来保证数据完整性用来保证数据完整性
-
外键外键:用来和其他表建立联系用的用来和其他表建立联系用的
-
索引索引:是提高查询排序的速度是提高查询排序的速度
个数:
-
主键主键:主键只能有一个主键只能有一个
-
外键外键:一个表可以有多个外键一个表可以有多个外键
-
索引索引:一个表可以有多个唯一索引一个表可以有多个唯一索引
京东广告数据部(机器学习)-2面-电话面试
1.SVM怎么防止过拟合?
2.决策树如何防止过拟合?
A: 剪枝,前剪枝和后剪枝;说了REP剪枝、C4.5是悲观剪枝
3.K-means聚类个数选择,做什么样的试验来确定K?
A:
(1)手肘法的核心指标是,误差平方和),画误差图,拐点就是的最佳值。
其中:
是第个簇
是第中的样本点
是第的质心(是所有样本的均值)
是所有样本的聚类误差,代表了聚类效果的好坏
(2)通过轮廓系数方法
美丽联合(算法工程师)-1面-电话面试
1.python...直接问你个开发中的实际问题吧,如果写的程序跑的非 常慢,多方面分析这个问题?
A:
(1)检查程序是否有多层嵌套循环,优化
(2)检查程序是否有很耗时的操作,看能否优化为多线程并行执行
(3)检查数据量是否非常大,考虑是否可以用分布式计算模型。
2.为什么要把原问题转换为对偶问题?
A:
-
因为原问题是凸二次规划问题,转换为对偶问题更加高效。
-
对偶问题往往更加容易求解(结合拉格朗日和 kkt条件)
-
可以很自然的引用核函数(拉格朗日表达式里面有内积,而核函数也是通过内积进行映射的)
3.为什么求解对偶问题更加高效?
A: 因为只用求解 系数,而 系数只有支持向量才非 0,其他全部为 0.
4.避免过拟合的方法
A: 决策树剪枝、L2正则和L1正则
5.为什么 L1正则可以实现参数稀疏,而L2正则不可以?
A: L1正则因为是绝对值形式,很多系数被压缩为0,而L2正则是很多系数被压迫到接近于 0,而不是0。
6.为什么L1很多系数可以被压缩为0,L2是被压缩至接近于0?
A: 图像上,
-
L1正则是正方形,
-
L2正则是圆形;
-
L1正则的往往取到正方形顶点,即有很多参数为0;
-
L2正则往往去不到圆形和参数线的交点,即很多分量被压缩到接近于0。
7.SQL中inner join和outer join的区别?
A: 一图便知晓
PS
由于一番星总结的面试经历较多,有机会我们在下一篇的文章继续介绍(ps:一番星大佬目前是字节的算法工程师哦!)
加助手进微信交流群、投稿或者直接加入QQ交流群
长按二维码关注ChallengeHub
ChallengeHub出品