一番星大厂面试经验分享第一弹

 

点击上方蓝字,订阅关注我们!

 

前言

感谢一番星汇总本次的面试经验,给出了部分面试问题的答案,希望更多人能从中收益,不断积累经验,在面试中优异表现,斩获更多大厂offer,成为offer收割机!

也欢迎更多的人联系我投稿,让更多人学习到你的经验与建议。

 

阿里菜鸟(机器学习)-1 面-电话面试

1.如何在海量数据(向量维度很高)中查找给定部分数据最相似的top200向量?

A: 由于之前了解过其他面试蚂蚁金服的朋友,也有问到这个题目的,所以反应比较快,直接就说可以用KD树、聚类、hash。

由于一天之内两次连续面试,问了很多机器学习算法的东西。比如:

  • (1)为什么LR需要归一化或者取对数?

  • (2)为什么LR把特征离散化之后效果更好?

  • (3)为什么把特征组合之后还能提升这一些问题。

反正这些基本都是增强了特征的表达能力,或者更容易线性可分吧。

2.SVM原问题和对偶问题关系?

A: 

首先明白为什么要引入对偶问题: 

(1)容易求解;

(2)核函数。

拉格朗日对偶没有改变最优解,但是改变了算法复杂度:原问题,样本维度;对偶问题,样本数量;所以线性分类 & 样本维度 < 样本数量:原问题求解(liblinear默认)。

非线性,升维:一般导致样本维度 > 样本数量:对偶问题求解

然后就是为什么要引入对偶算法:

 (1)对偶问题往往更加容易求解(结合拉格朗日和KKT条件)

(2)可以很自然的饮用很函数(拉格朗日表达式里面有内积,而核函数也是通过内积进行映射的)

3.KKT条件有哪些,完整描述下?

4.LR为什么用 sigmoid函数,这个函数有什么优点和缺点?为什么不用其他函数?

A: 一图便知晓

图片

5.L1正则化为什么可以把系数压缩成0,坐标下降法的具体实现细节?

 

 

京东广告数据部(机器学习)-1面-电话面试

 

1.说一下进程和线程?

2.线程安全的理解?

3.有哪些线程安全的函数?

A: 一图便知晓

 

图片

 

4.数据库中的主键、索引和外键,以及作用?

A: 一个表可以没有主键,可以有索引

定义:

  • 主键主键:唯一标识一条记录,不能有重复的,不允许为空唯一标识一条记录,不能有重复的,不允许为空;

  • 外键外键:表的外键是另一表的主键表的外键是另一表的主键, 外键可以有重复的外键可以有重复的, 可以是空值可以是空值;

  • 索引索引:该字段没有重复值,但可以有一个空值该字段没有重复值,但可以有一个空值

作用:

  • 主键主键:用来保证数据完整性用来保证数据完整性

  • 外键外键:用来和其他表建立联系用的用来和其他表建立联系用的

  • 索引索引:是提高查询排序的速度是提高查询排序的速度

个数:

  • 主键主键:主键只能有一个主键只能有一个

  • 外键外键:一个表可以有多个外键一个表可以有多个外键

  • 索引索引:一个表可以有多个唯一索引一个表可以有多个唯一索引

 

 

京东广告数据部(机器学习)-2面-电话面试

 

1.SVM怎么防止过拟合?

2.决策树如何防止过拟合?

A: 剪枝,前剪枝和后剪枝;说了REP剪枝、C4.5是悲观剪枝

3.K-means聚类个数选择,做什么样的试验来确定K?

A:

(1)手肘法的核心指标是,误差平方和),画误差图,拐点就是的最佳值。

其中:

是第个簇

是第中的样本点

是第的质心(是所有样本的均值)

是所有样本的聚类误差,代表了聚类效果的好坏

(2)通过轮廓系数方法

图片

 

 

美丽联合(算法工程师)-1面-电话面试

 

1.python...直接问你个开发中的实际问题吧,如果写的程序跑的非 常慢,多方面分析这个问题?

A:

(1)检查程序是否有多层嵌套循环,优化

(2)检查程序是否有很耗时的操作,看能否优化为多线程并行执行

(3)检查数据量是否非常大,考虑是否可以用分布式计算模型。

2.为什么要把原问题转换为对偶问题?

A:

  • 因为原问题是凸二次规划问题,转换为对偶问题更加高效。

  • 对偶问题往往更加容易求解(结合拉格朗日和 kkt条件)

  • 可以很自然的引用核函数(拉格朗日表达式里面有内积,而核函数也是通过内积进行映射的)

3.为什么求解对偶问题更加高效?

A: 因为只用求解  系数,而  系数只有支持向量才非 0,其他全部为 0.

4.避免过拟合的方法

A: 决策树剪枝、L2正则和L1正则

5.为什么 L1正则可以实现参数稀疏,而L2正则不可以?

A: L1正则因为是绝对值形式,很多系数被压缩为0,而L2正则是很多系数被压迫到接近于 0,而不是0。

6.为什么L1很多系数可以被压缩为0,L2是被压缩至接近于0?

A: 图像上,

  • L1正则是正方形,

  • L2正则是圆形;

  • L1正则的往往取到正方形顶点,即有很多参数为0;

  • L2正则往往去不到圆形和参数线的交点,即很多分量被压缩到接近于0。

7.SQL中inner join和outer join的区别?

A: 一图便知晓

图片

 

 

PS

由于一番星总结的面试经历较多,有机会我们在下一篇的文章继续介绍(ps:一番星大佬目前是字节的算法工程师哦!)

 

 

加助手进微信交流群、投稿或者直接加入QQ交流群

图片图片

 

长按二维码关注ChallengeHub

 

ChallengeHub出品

图片

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值