20190821美团机器学习风控团队(面试)

 

 一面-20190821-电话:

1.介绍下你自己

2.讲下研究生课题的具体实现,这里面扣了很多细节

3.SVM与神经网络的联系和区别

  1.均可以处理分类或者是回归问题。

  2.SVM针对小样本问题,神经网络针对大样本问题,是样本趋于无穷大时的最优解。

  3.神经网络是个黑盒子模型,对于其中的特征处理不具有可解释性,而SVM的目标是寻找拥有最大边际的决策边界,如果在当前特征空间线性不可分的话,会引入kernel trick的机制,映射到另外一个特征空间后再寻找决策超平面。

  4.寻求解的问题,对SVM找到的是全局最优解,而神经网络很可能陷入局部最优。

  5.求解参数的问题:神经网络采用BP算法更新参数;SVM其实是凸优化问题,构造了拉格朗日函数,再通过满足KKT条件来获取其对偶函数,从而用smo或者二次规划来求解问题。

 

4.L1,L2对比和联系,已经理论推导

5.样本不平衡的处理方式

6.GBDT与XGboost算法的区别,详细扣了xgboost

7.决策树、随机森林和XGboost之间的联系和区别

8.kmeans的优缺点

  优点:原理简单,实现容易

  缺点:

  1. 收敛较慢
  2. 算法时间复杂度比较高 O(nkt)O(nkt)
  3. 不能发现非凸形状的簇
  4. 需要事先确定超参数K
  5. 对噪声和离群点敏感
  6. 结果不一定是全局最优,只能保证局部最优

9.风控领域了解吗?了解啥?由于小姐姐是风控团队的,问了很多风控的知识,要我回去好好补补风控的东西。

10.手写过神经网络的推导吗?(编程实现),BP呢?

11.学过数据结构与算法吗?刷过leetcode吗?

12.评价指标有啥?

13.推荐系统的评价指标

 

  推荐系统的指标:推荐系统最为重要的指标是准确率,即预测的准确率。例如预测某个用户是否会购买某个商品。但是准确率并不是总能衡量一个推荐系统的优劣。为了评价推荐系统对三方利益的影响,推荐系统还有一下衡量指标:

 指标包括准确度、覆盖度、新颖度、惊喜度、信任度、透明度等。这些指标中,有些可以离线计算,有些只有在线才能计算,有些只能通过用户问卷获得。 

 

14.讲一下你熟悉的分类算法?

15.调参的作用,重要性?

16.你有啥要问我的?

 

 

美团二面-20190827-现场:
1.介绍你自己
2.逻辑回归,svm,dt哪个算法和神经网络最接近?
3. 是神经网络过拟合怎么解决?
4.逻辑回归的缺点?和优点  怎么解决逻辑回归多重共线性的问题?

  1)优点:

  • 实现简单,速度快,占用内存小,可在短时间内迭代多个版本的模型。
  • 模型的可解释性非常好,可以直接看到各个特征对模型结果的影响,可解释性在金融领域非常重要,所以在目前业界大部分使用的仍是逻辑回归模型。
  • 模型客群变化的敏感度不如其他高复杂度模型,因此稳健更好,鲁棒性更强。
  • 特征工程做得好,模型的效果不会太差,并且特征工程可以并行开发,大大加快开发的速度。
  • 模型的结果可以很方便的转化为策略规则,且线上部署简单。

  2)缺点和局限性:

  • 容易欠拟合,相比集成模型,准确度不是很高。
  • 对数据的要求比较高,逻辑回归对缺失值,异常值,共线性都比较敏感,且不能直接处理非线性的特征。所以在数据清洗和特征工程上会花去很大部分的时间。
  • 在金融领域对场景的适应能力有局限性,例如数据不平衡问题,高维特征,大量多类特征,逻辑回归在这方面不如决策树适应能力强。
共线性问题

5.PCA的原理,PCA的缺点,优点
6.为什么选择风控,为什么不留在海康?
7.剩下的更多是闲扯,由于和面试官是老乡,同时我蚂蚁二面的老师是他是前同事关系,就巴拉巴拉扯了很多

 

美团三面-20190827-现场:
1.介绍下你自己
2.先来道算法题吧,写出二叉树的中序遍历(思路是对的,不过写出来的代码有些问题)
那再来道算法题目吧,给出字符串‘aaabbcdd’输出‘3a2b1c2d’
我首先拿dict中value存储了字符串,key表示字符串出现的次数。(这个面试官认为可以遍历一次获取结果,后来我提出拿2个list,一个存字符串,一个存出现次数,在存的过程中就连接)
3.为啥不留在海康?为啥不换组
 
这个问题可以好好想想:1.首先肯定的是我的业务能力,学习能力没有问题,在海康我是有机会留下来的,但是在三个月的实习期中,我的职业想法更加成熟了。
                                        2.兴趣问题;在对风控的不断了解下,我个人觉得这个方向适合我的发展,因为我对这个领域的探索欲望很强烈,觉得这个领域除了模型本身之外,更读多的是对人性,对                                                               业务的理解,这是个很有意思的领域。
                                        3.出于职业规划的考量;我觉得这个领域很有发展前景,也很有意思。我对自己的规划是:

4.图像算法和机器学习算法的不同?
5.你的SCI论文是一作吗?有啥创新点和改进?
6.你有啥爱好?然后闲扯了会儿
7.为啥选择这个风控方向?
8.你对风控有啥了解?我讲了我做了2个饭案例,一个是信用卡欺诈做异常检测,一个是做评分卡,针对这两个案例有又问了相关的问题
9.你在使用美团的过程中有什么不好的体验,觉得有什么需要改进的?这个回答不怎么样?后来又提出针对淘宝呢?有啥需要改进的?
1.本科的时候,在外地玩,预定酒店的问题:你在美团上预定成功,但是线下无法消费;--现在没有这个问题
2.美团上自带的电影平台,点进去每个场次没有票的余量信息,需要用户每场点进去查看,不方便。
3.美团上饭店线下消费,与正常消费区别对待。
4.之前在美团打车,司机单项取消订单,投诉问题。说是要退我手续费,也没退。
5.消费券有时间限制,例如只能周一到周五,或者周一周日等等,提醒不够明显,导致用户购错时间的优惠。
6.有一次通过美团买药,快递迟到很久,联系美团客服,直接让提供订单号,为什么这里不能直接提供手机号码呢?让客服通过手机号码来查找我的订单号,因为我在打电话的过程中,又无法联网,查订单号;那我挂掉电话,再次拨通可能又是另外一个人了,又要重新解释。还有就是卖家电话的真伪性,有的电话压根打不通。
7.美团里面涉及的功能过于冗余,可能我用户只需要用那么几个特定的功能,现在界面比较多而复杂,可以考虑定制功能,将一些模块隐藏,或者参考微信小程序的一些东西。
 
百度到的:

美团点评对黑产有着巨大的吸引力,归纳起来在这些方面尤其突出:

  • 用户作弊:大家常说的“薅羊毛”,用户为了骗取促销优惠的作弊行为。
  • 商家刷单:常见的有刷排名、刷销量、刷好评等违反商家平台协议的行为。
  • 账户和支付安全:公民信息盗用形势已经十分严峻,黑产从业者会在电商平台上盗取用户的余额,或使用他人支付信息来消费。

这些行为严重侵害平台用户和商户的利益、扰乱正常交易秩序,处理结果的好坏将决定整个业务的成败。所以美团点评需要一套灵活高效的风险控制系统和工作机制来防控这些风险。

归纳一下,风控系统面临的挑战有:

  • 业务多、风险点多:上面提到的风险涉及到各个业务的购买流程、用户操作、商家操作等多个场景。
  • 变化快:黑产的攻击手段升级,自身业务在变化,互联网环境也会不断变化。
  • 我在明、敌在暗:平台在明处,但攻击者是谁、会在什么时候出现、用什么方式进攻却无法预知。
 

短信通道保护

有效保护短信接口,确保所有的短信都准确发给正常的用户;

注册保护

高效识别批量注册、模拟器注册、代理IP注册、异常手机号等违规注册行为;

登录保护

高效识别撞库盗号、模拟器登录、篡改设备登录、异常手机号登录、代理IP登录等违规行为;

羊毛党防刷

高效禁止刷单、刷人气、刷好评、机器秒杀、抢优惠劵等违规行为;


10.你写博客在哪个平台,有人评论吗?哪篇博客浏览量最高,是什么?我提出自己有写周报的习惯。
11.你有啥问我的吗?
12.git的一些命令,代码冲突如何解决?(这个我貌似吧git和docker弄混了)

 

转载于:https://www.cnblogs.com/ivyharding/p/11391514.html

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本文根据“第八届中国系统架构师大会”演讲内容整理而成。 背景 美团最初以团购的形式出现,到现在有了很大的业务形态转变。尤其是经过与大众点评的业务融合,从单一业务发展成了覆盖到店餐饮、到店综合、猫眼、外卖、酒店、旅游等多个垂直领域的综合性电商,并且在各个领域都处于行业领先的地位。在这背后,美团点评不仅面临激烈的行业竞争,还有黑色产业(以下简称“黑产”)带来的各种风险,因为我们的业务有这样一些特点: • 品类多、覆盖面广:包括几乎所有吃喝玩乐服务,其中不乏容易被销赃的品类。 • 用户多、商户多:美团点评拥有6亿以上用户,400万以上合作商家,覆盖了很大部分国内网民和商户。 • 交易高频:每日订单峰值突破千万。 美团点评对黑产有着巨大的吸引力,归纳起来在这些方面尤其突出: • 用户作弊:大家常说的“薅羊毛”,用户为了骗取促销优惠的作弊行为。 • 商家刷单:常见的有刷排名、刷销量、刷好评等违反商家平台协议的行为。 • 账户和支付安全:公民信息盗用形势已经十分严峻,黑产从业者会在电商平台上盗取用户的余额,或使用他人支付信息来消费。 这些行为严重侵害平台用户和商户的利益、扰乱正常交易秩序,处理结果的好坏将决定整个业务的成败。所以美团点评需要一套灵活高效的风险控制系统和工作机制来防控这些风险。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值