一面-20190821-电话:
1.介绍下你自己
2.讲下研究生课题的具体实现,这里面扣了很多细节
3.SVM与神经网络的联系和区别
1.均可以处理分类或者是回归问题。
2.SVM针对小样本问题,神经网络针对大样本问题,是样本趋于无穷大时的最优解。
3.神经网络是个黑盒子模型,对于其中的特征处理不具有可解释性,而SVM的目标是寻找拥有最大边际的决策边界,如果在当前特征空间线性不可分的话,会引入kernel trick的机制,映射到另外一个特征空间后再寻找决策超平面。
4.寻求解的问题,对SVM找到的是全局最优解,而神经网络很可能陷入局部最优。
5.求解参数的问题:神经网络采用BP算法更新参数;SVM其实是凸优化问题,构造了拉格朗日函数,再通过满足KKT条件来获取其对偶函数,从而用smo或者二次规划来求解问题。
4.L1,L2对比和联系,已经理论推导
5.样本不平衡的处理方式
6.GBDT与XGboost算法的区别,详细扣了xgboost
7.决策树、随机森林和XGboost之间的联系和区别
8.kmeans的优缺点
优点:原理简单,实现容易
缺点:
- 收敛较慢
- 算法时间复杂度比较高 O(nkt)O(nkt)
- 不能发现非凸形状的簇
- 需要事先确定超参数K
- 对噪声和离群点敏感
- 结果不一定是全局最优,只能保证局部最优
9.风控领域了解吗?了解啥?由于小姐姐是风控团队的,问了很多风控的知识,要我回去好好补补风控的东西。
10.手写过神经网络的推导吗?(编程实现),BP呢?
11.学过数据结构与算法吗?刷过leetcode吗?
12.评价指标有啥?
13.推荐系统的评价指标
推荐系统的指标:推荐系统最为重要的指标是准确率,即预测的准确率。例如预测某个用户是否会购买某个商品。但是准确率并不是总能衡量一个推荐系统的优劣。为了评价推荐系统对三方利益的影响,推荐系统还有一下衡量指标:
指标包括准确度、覆盖度、新颖度、惊喜度、信任度、透明度等。这些指标中,有些可以离线计算,有些只有在线才能计算,有些只能通过用户问卷获得。
14.讲一下你熟悉的分类算法?
15.调参的作用,重要性?
16.你有啥要问我的?
1.介绍你自己
2.逻辑回归,svm,dt哪个算法和神经网络最接近?
4.逻辑回归的缺点?和优点 怎么解决逻辑回归多重共线性的问题?
1)优点:
- 实现简单,速度快,占用内存小,可在短时间内迭代多个版本的模型。
- 模型的可解释性非常好,可以直接看到各个特征对模型结果的影响,可解释性在金融领域非常重要,所以在目前业界大部分使用的仍是逻辑回归模型。
- 模型客群变化的敏感度不如其他高复杂度模型,因此稳健更好,鲁棒性更强。
- 特征工程做得好,模型的效果不会太差,并且特征工程可以并行开发,大大加快开发的速度。
- 模型的结果可以很方便的转化为策略规则,且线上部署简单。
2)缺点和局限性:
- 容易欠拟合,相比集成模型,准确度不是很高。
- 对数据的要求比较高,逻辑回归对缺失值,异常值,共线性都比较敏感,且不能直接处理非线性的特征。所以在数据清洗和特征工程上会花去很大部分的时间。
- 在金融领域对场景的适应能力有局限性,例如数据不平衡问题,高维特征,大量多类特征,逻辑回归在这方面不如决策树适应能力强。
5.PCA的原理,PCA的缺点,优点
6.为什么选择风控,为什么不留在海康?
7.剩下的更多是闲扯,由于和面试官是老乡,同时我蚂蚁二面的老师是他是前同事关系,就巴拉巴拉扯了很多
1.介绍下你自己
2.先来道算法题吧,写出二叉树的中序遍历(思路是对的,不过写出来的代码有些问题)
那再来道算法题目吧,给出字符串‘aaabbcdd’输出‘3a2b1c2d’
我首先拿dict中value存储了字符串,key表示字符串出现的次数。(这个面试官认为可以遍历一次获取结果,后来我提出拿2个list,一个存字符串,一个存出现次数,在存的过程中就连接)
3.为啥不留在海康?为啥不换组
4.图像算法和机器学习算法的不同?
5.你的SCI论文是一作吗?有啥创新点和改进?
6.你有啥爱好?然后闲扯了会儿
7.为啥选择这个风控方向?
8.你对风控有啥了解?我讲了我做了2个饭案例,一个是信用卡欺诈做异常检测,一个是做评分卡,针对这两个案例有又问了相关的问题
9.你在使用美团的过程中有什么不好的体验,觉得有什么需要改进的?这个回答不怎么样?后来又提出针对淘宝呢?有啥需要改进的?
美团点评对黑产有着巨大的吸引力,归纳起来在这些方面尤其突出:
- 用户作弊:大家常说的“薅羊毛”,用户为了骗取促销优惠的作弊行为。
- 商家刷单:常见的有刷排名、刷销量、刷好评等违反商家平台协议的行为。
- 账户和支付安全:公民信息盗用形势已经十分严峻,黑产从业者会在电商平台上盗取用户的余额,或使用他人支付信息来消费。
这些行为严重侵害平台用户和商户的利益、扰乱正常交易秩序,处理结果的好坏将决定整个业务的成败。所以美团点评需要一套灵活高效的风险控制系统和工作机制来防控这些风险。
归纳一下,风控系统面临的挑战有:
- 业务多、风险点多:上面提到的风险涉及到各个业务的购买流程、用户操作、商家操作等多个场景。
- 变化快:黑产的攻击手段升级,自身业务在变化,互联网环境也会不断变化。
- 我在明、敌在暗:平台在明处,但攻击者是谁、会在什么时候出现、用什么方式进攻却无法预知。
短信通道保护
有效保护短信接口,确保所有的短信都准确发给正常的用户;
注册保护
高效识别批量注册、模拟器注册、代理IP注册、异常手机号等违规注册行为;
登录保护
高效识别撞库盗号、模拟器登录、篡改设备登录、异常手机号登录、代理IP登录等违规行为;
羊毛党防刷
高效禁止刷单、刷人气、刷好评、机器秒杀、抢优惠劵等违规行为;
10.你写博客在哪个平台,有人评论吗?哪篇博客浏览量最高,是什么?我提出自己有写周报的习惯。
11.你有啥问我的吗?