Capital one面经

2018(7-9月) 分析|数据科学类 博士 全职@Capital One - 校园招聘会 - 技术电面  | Other | fresh grad应届毕业生

趁金鱼记忆没有消失的时候赶紧写一下攒个人品
LZ是转行PhD申请DS。上周和recruiter电话聊了就立刻安排了电面。
一个data scientist manager面的,感觉还是很nice的,如果答错了或者漏答了会停下来提醒几遍,如果是比较开放式的问题,答出新的点就会去下一个题。
自我介绍以后就开始问那个经典的预测信用卡用户会不会关户的问题。如果给你一堆dataset,比如信用卡一年的交易记录、客户个人信息,银行想预测客户会不会在一个月之内关户,如果会的话,银行打算发一点cashback rewards给这些人挽留一下。让你建模预关户。  以下是面试官的问题:

以下内容需要积分高于 200 您已经可以浏览


1.        你会选哪些feature?(感觉是随便说,只要有关系。追问如果是一堆transaction的日期之类的,应该怎样rebuild feature)
2.        怎么做data cleaning: 
    a.            怎样detect outlier? . From 1point 3acres bbs
    b.            怎样fill in missing data?(我说可以填constant比如mean,然后他追问填mean在什么情况下不合适、怎样更好)
    c.            如果target value也missing了怎么办
3.        你选什么model?(我说decision tree,然后他让我说有没有其他model,优缺点分别是什么,target是什么。target应该是一个binary的值whether the customer will close the account in one month,如果regression得到了0~1之间的值就代表how likely)
4.        怎么看model 的performance,用什么package . From 1point 3acres bbs
5.        如果data size很大有1TB,怎样sample,用什么package . From 1point 3acres bbs
6.        如果model不准确,会给银行造成什么损失?
7.        如果用model predict得到了一堆target的值,应该怎样根据target发rewards (我说画个distribution,给最可能关户的百分之几客户发rewards。追问除了这种方式还有什么方式,我也不确定是考modeling还是business sense)
8.        最后一个是地里看到的一模一样的open question,两人都有5000limit,但是一个用100%一个只用2%,这两人有没有可能都在一月之内关户。面试官应该看你第一反应是考虑model的问题还是考虑其他方面。

 

2015(1-3月) 分析|数据科学类 硕士 全职@Capital One - 网上海投 - 技术电面 在线笔试  | Other | fresh grad应届毕业生

刚面完的C1,很热很烫的面经。
HR面:
问问简历问题,还有你会些什么语言擅长什么。

OA:在hackerrank做的,所有题都要自己写Scanner in = new Scanner(System.in)来读入。
1. 读入m和n,m个coins,有n个heads的概率是多少。有一个test case一直过不了,不知道是哪个边界条件。
2. 和Leetcode的anagrams类似,读入一个String,所有单词以空格隔开,除了数字和字母以外的字符都要去掉,大小写也不算。比如"R&D","dR"这种也算anagrams,最后每一行输出一组anagrams
3. 读入一个,我用了LC上的NP套路来做,也就是combinations, subset这种题的套路。

两天后被通知电面。
电面我真蛋疼,人生的第一个印度面试官,人其实不错的。一开始打电话过来我完全听不懂,我以为是我听力不好,差点都哭出来了,后来他换了个电话,我瞬间听得很清楚了,超级清楚完全没杂音,所以想问一下大家啊!是不是不同移动公司会有这种情况,因为我电面很多次了,大部分都是听得很清楚,有些时候就会出现这种听上去有点嘈杂,而且会有1 2秒的延迟。

1. 简历问题,问的非常细致,我之前做过一个推荐系统,这个面试官对这一块非常擅长,所以问得很细很专业,我没答好,加上一开始的确听不懂。所以建议大家可以先linkedin面试官,看看他擅长什么,我遇到过几次面试官喜欢问自己擅长的东西。
2. 一个超市,有100个顾客的list,
以下内容需要积分高于 133 您已经可以浏览

70个男的,30个女的,如果用这个数据做数据分析会有什么statistical issues,问这个100个顾客会是什么样的distribution

Simpson's paradox

3. walk through一个mapreduce问题,一组数据,四个columns: name, category, # of transactions in 2014, dollar values of transaction in 2014,需要知道每个category的average dollar values per transaction,怎么用mapreduce做,其实就specify一下mapper和reducer的input和output,然后在reducer里求一下平均值什么的。
walk through一个mapreduce问题,一组数据,四个columns: name, category, # of transactions in 2014, dollar values of transaction in 2014,需要知道每个category的average dollar values per transaction,怎么用mapreduce做,其实就specify一下mapper和reducer的input和output,然后在reducer里求一下平均值什么的

我感觉是跪了,C1的DS面经地里估计是第一个,求大米啊求大米。


补充内容 (2015-3-20 00:13):
OA第三题没打完= =
读入一个数字,还有多个面值,这些面值能组成这个数字的方法有多少个。比如读入数字是10,面值是(10, 5, 1),应该有4种。

 

2019(10-12月) 分析|数据科学类 博士 全职@Capital One

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值