北美数据科学求职攻略
作者| AzuralRainbow 编辑|树袋熊 36大数据授权发布
由于本文由大量的英文简写,为了方便阅读理解,36大数据特别为大家准备了一份中英文对照/简写对照。参加文章末尾。
![墨迹晕染分割线 640?wx_fmt=png](https://i-blog.csdnimg.cn/blog_migrate/9bacd60a817031e31e899eb3466f4dcd.png)
下面是文章正文:
最开始了解数据科学这个领域也是在知乎上,大约是2015年的时候,之后就开始了漫长的转行之路。主要原因倒不是媒体吹捧的工资高酷炫AI什么的,确实有热情和兴趣在里面。所以即使找全职的时候市场行情不太好,有考虑过刷题转SDE或者从BA之类的做起,或者做本专业最对口的quant,但还是坚持找DS。幸运的是一路有很多朋友给了我许多帮助,最后如愿在纽约找到了一份DS的工作。
转行的过程中知乎的帮助也很大,包括从各路大神的文章和答案中取经。我几年来也没有在知乎上输出什么内容,毕竟自己太菜。这次终于有机会“反哺”,和大神 @微调聊了聊行业情况,准备把自己求职中的一些心得想法记录一下,提供给考虑转行的同学们作为参考。
这份心得主要适用于在北美读书,希望在北美就业的同学,特别是那些背景不是很match的同学。对口方向的名校PhD(包括CS,stats,OR等)和CS强校的对口master(CS, ML)大神们,no worry,你们依然是“炙手可热”,横扫几个offer不成问题。
数据科学大热差不多是在2015年左右。在2015到2017年这个阶段市场行情火爆,需求大从业者少,相对来说找到一份DS的工作不是那么难。但是在2018年不再是这样了,对于转行的同学来说,找一份entry level的DS工作非常困难。原因基本可以从供应和需求两部分来分析。
自从2015年以来Alpha Go大热,各路媒体吹捧,很多同学(包括我)都涌入这个行业。如果大家浏览未来五年,数据科学家(Data Scientist)的岗位需求会如何变化?类似的帖子会发现,DS行业的高端人才还是很稀缺的,但是整体供应量逐年升高。如果你在美国读master,在找DS工作时候面临的竞争有:
核心专业的同学(对口PhD和master,比如CMU Ms in ML)
其他方向的PhD同学,比如EE(这个还算对口了),生物,材料,化学,甚至policy等文科方向
其他专业的master同学,比如EE,OR,stats,数学,各种和data交叉的项目(很多)
第一类同学主申的项目和我们都没有什么关系,比如FB core DS,Airbnb Algo这种,基本不会有回复。问题是第二类和第三类同学加起来基数非常大,大部分没有DS或者quantitative role的工作经验,大家找的都是entry level DS的工作,简历完全淹没在大海之中。
换句话说,如果你手握NIPS/KDD/EMNLP这些会议,拿到面试不成问题(我不止一次面试的时候遇到有NIPS的大神小伙伴)。但是如果你的DS经历不太丰富,只上过几门Python和吴老师的机器学习,想过简历关不太现实。
Supply的问题还要结合demand。我在秋招之前觉得现在任何公司都需要DS,肯定有大量面试等着我。然而很快我发现问题了:Data Scientist是一个特别需要real industry experience的职业。你可以在领英上找到很多DS的职位,但是投完大部分石沉大海。因为这些职位基本都是社招岗位,很多都需要至少1年以上的工作经验。基本上那些传统企业比如银行,或者一些中小型的公司,startup,都只想要有经验的人来了直接撸袖子干货,而没有精力培养新人。
那走校招怎么样呢?部分大公司特别是科技公司是有校招的,也就是在“University”这个类别下的Data Science New Grad。这种确实有,数量也不算少,但是和supply相比那就竞争太激烈了。不过如果有一些DS的经历,这部分还是能拿到一些面试的,可能要看refer和背景是否match的情况了。
校招另一个坑就是会有很多OA(online assessment)来做,这部分我做了大概10+ OA,只有两家转化成后续面试,其中一家还是我随便做的,hirevue录像都黑乎乎的,应该是简历match通过的。我猜测大部分公司校招OA都是群发的,导致求职的时候可能每个校招都有OA,但是花时间做完了也石沉大海。好处是可以练习coding和一些ML的知识。
DS的一些职位也会有data challenge,或者叫case study。DS challenge稍微好一点,一般是HR已经对你有兴趣之后让你做,一般大概花上几个小时甚至更多。这部分我的通过率是百分之百。后续经常会follow要求present这个challenge给组里的人,作为面试的一部分。
社招有的时候也会要求做case。总的来说社招海投的成功率很低,如果JD上明确了2+ experience的话基本是没戏的,3+以上的我就直接过滤掉了。关于经验的要求可能要看hiring manager的意思,我也面过一些senior的职位(虽然都挂了)。但是某些大公司就会把校招和社招分开,new grad只看校招。比如某今年准备上市的独角兽,因为好心学姐给了我一个strong referral,所以HR联系了我,但是后来因为hiring manager的硬性要求是master+1 yr exp或者PhD,所以没有进入面试流程。很遗憾,但是fresh master真的很苦逼。。。
除此之外,DS行业还有一个伪需求的问题。说到DS,大家想到的都是什么深度学习,Alpha狗。但是实际上,别说DL,ML对于很多公司来说其实是没有用武之地的。对于一些公司DS, Analytics其实是偏BA,另一些公司是做AB testing的统计分析型,比如我面过某家SF的公司,做的产品是2B的,横向对比slack,他们产品不需要太多ML的功能。对于很多DS职位来说,学那么多ML用不上,还不如多复习一下大一统计课的统计推断呢。
对于不是一心想钻进DS行业大坑的同学:
如果一定要在美国就业,最好找工作的还是SDE(software engineer)。多刷刷题,总能找到,几乎所有公司都需要SDE。
如果还是想做data相关,可以找BA/BI,技术好一点的可以做DA。DA会对SQL要求很高,一般也需要一些python。虽然很多公司对于DS是伪需求,但是他们真的需要DA呀!虽然待遇可能比DS差一点,但是入行之后有了工作经验可以升职转DS。
提早准备,建立好自己的background。如果是year 1抓紧找实习,DS的intern机会相比full time会多一些,因为很多公司都直接走return不怎么对外校招了。做一些有质量的project,这样找人refer的时候言之有物,不要自己没有什么经历就希望对方给refer。最好在某个ML的领域有一定specialization,比如NLP, CV, fraud detection, marketing DS等等,这样会更match一些职位。
至于面试准备就见仁见智,大概就是ML/简历/算法/python/SQL/结合实际问题的case question/偶尔一些数学题。DS还有一个坑就是面试的题库范围太广了,什么都能问。多面试,多积累,后期就有信心了。
以上全部都是个人观点,希望尽量给还没有上岸的朋友一些帮助。也希望业内大神(特别是做搜索、推荐、NLP领域的)多多交流指点 )逃~~~
![金属质感分割线 640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/a55bc78906fa2a500c10ea45f45c17bc.jpeg)
本文文中专有名词中英文对照、简写对照:
SDE,软件开发工程师,Software Develop Engineer
BA,商业分析师,业务需求分析师 Business Analyst
DS,数据科学家 ,Data scientist
CS,计算机科学 Computer science
Stats 统计学
EE,电子工程专业,英语为Electronic Engineering
OR 运筹学 Operations Research
ML 机器学习 Machine Learning
Supply,供给,Demand,需求
OA(online assessment) 在线评估
DA,Data Analysis,数据分析师
2B,也有写成 BTB,Business-to-Business 企业与企业的业务、服务
SDE(software engineer)软件工程师
NLP,自然语言处理 Natural Language Processing,
CV,计算机视觉 Computer Vision
BI,商业智能,Business Intelligence
Fraud Detection 反欺诈
Marketing DS 市场营销数据分析师、营销专家、业务分析师
Specialization 专业化,特长
new grad,应届毕业生
PhD ,Philosophic Doctor,指哲学博士学位,现泛指学术研究型博士学位
Master 硕士
Master 学习的是应用型内容,PhD 研究的是学术型内容。美国的4年本科之后,统称为graduate education(可以叫研究生教育)。美国学校基本上把研究生教育分成两类,一类是硕士,一类是博士。记住,是并列的关系,而不会像国内,普遍是递进关系。而Master呢,强调的是“breadth”。一个MS学生一年就得学6-8门课,而一个PhD6年才会上不到10门课。硕士以应用、就业为导向,而PhD以深入的学术研究为导向。
![金属质感分割线 640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/a55bc78906fa2a500c10ea45f45c17bc.jpeg)
![640?wx_fmt=png](https://i-blog.csdnimg.cn/blog_migrate/1d7de119f6021b56805fa232bf3b8a0c.png)
新年新气象,36大数据社群(大数据交流、AI技术学习群、机器人研究、AI+行业、企业合作群)火热招募中,对大数据和AI感兴趣的小伙伴们。增加AI小秘书微信号:a769996688,说明身份即可加入。
![640?wx_fmt=jpeg](https://i-blog.csdnimg.cn/blog_migrate/0c6477574b3d0fbdbe68fb001f0d5081.jpeg)
欢迎投稿,投稿/合作:dashuju36@qq.com
如果您觉得文章不错,那就分享到朋友圈~