当我说要做大数据工程师时他们都笑我,直到三个月后……

专栏 | 九章算法

网址 | www.jiuzhang.com

当我说要做大数据工程师时,他们都笑我,为什么不去 backend 这种热门的岗位。直到三个月后,我先拿到了 Google 的 Data Scientist……

Ccomputer Science 毕业的学生,对 backend、frontend、MySQL等几乎都是耳熟能详,然而对 Big Data 相关的岗位,就了解不多。

大数据人才稀缺,薪资在120k起

据调查显示,仅仅在美国市场,2018年大数据和高级分析相关人才的缺口就将高达19万。截止2020年,大数据相关岗位将增加至少15%

高需求,意味着高回报。大数据相关岗位的薪资也在较高的水平。这里统计出了数据科学家薪酬排名前五的以下5家科技公司。

Big Data 相关岗位需要的技能树

数据科学家这个职业的定义很广泛。在不同行业不同公司,即使岗位名称同样叫做数据科学家,他们的工作内容也可能是不一样的。这也就是说这个职业有很多分类。

比如:

  • 如果这个职位对你的编程能力要求很高,那么,建议你看一看与软件工作师有关的面试题。
  • 如果这个职位要求你有很高的统计技术,并且需要你了解不同的人口分布、懂得如何设计实验、熟悉如何设置A / B测试和假设测试等,你就要对这些内容进行学习和练习。

所以在面试前,你一定要明确你申请的岗位所要求的技能和职责,因为这决定着你面试时会遇到什么样的题目。

以下是 Linkedin 统计出的高需求数据分析技能,其中 MapReduce, Machine Learning, Hadoop位居前列。

如何准备数据科学家面试

接下来,我们来谈谈应该如何准备数据科学家面试。

1.向招聘人员询问面试流程

向招聘人员询问面试流程,了解准备面试时可以使用哪些资源以及面试时的着装要求。

可以的话,询问一下面试官的姓名,这样你就可以在网上查找他们的相关资料,从而了解他们的专业领域等信息,并就此作准备,会起到事半功倍的效果。

2.在网上查找以往的面试题

你可以在网上查找你将要面试的公司数据科学家这一岗位的相关面试题,包括行为问题和技术问题。

就算你找不到你将要面试的公司的面试题,你也可以看看其他公司的面试题,让心中对面试问题的类型有个大体了解。

3.提前准备好行为问题的答案

在面试前你要提前准备好你可能遇到的行为问题以及这些问题的答案。

比如说你可能遇到这些问题:

  • 你对要工作的内容感兴趣吗?

  • 你会如何对待团队工作?

  • 你愿意做一些烦人的工作吗?比如清理杂乱的数据。

  • 在这个行业,每个公司都想努力解决的问题是什么?你和你的团队将如何发挥作用?

想要回答好这些问题,你可以查找相关资料并结合自身经验在面试前准备好这些问题的答案,这样当你面试过程中遇到这些问题时,你就能逻辑很清晰的表达出来。

4.仔细阅读招聘要求

查看你那份工作的招聘要求,从中挖掘出你的优势和兴趣。并在面试官根据这些要求提问时说出你的兴趣和优势。这样不仅能体现出你对这份岗位的精准了解,而且能表现出的你的专业能力,从而让你在面试中脱颖而出。

比如:

  • 招聘要求:精通X语言。

  • 面试时:可突出——我本身会Python,所以我学公司要求的X语言是很快的。

  • 招聘要求:会用不同的NLP模块分析文本。

  • 面试时:可突出——我很擅长用不同的NLP模块分析文本,并加以举例。

  • 招聘要求:熟练掌握web-scraping和web-pages-inspecting

  • 面试时:可突出——我会用web scrap和查找web页面写一个爬虫,并举例。

  • 招聘要求:能在SQL和NoSQL数据库找数据。

  • 面试时:可突出——我很擅长在SQL和NoSQL数据库找数据并基于这些数据分析模块。

5.熟悉你的项目经历

每轮面试前,重温一下自己的简历。因为,大多数面试官会根据你简历上所写的项目进行提问。所以,做一个perfect的总结至关重要。

准备工作:

  • 翻看你的项目资料,回顾一下技术细节。

  • 准备一下你在设计项目时使用数据科学的过程,里面需要包括:你为什么选择这个方法、你对项目的个人贡献、你遇到的挑战、你在这个过程中学到的东西。

  • 多加练习,确保你的总结是连贯的。

6.编程(通常要求在白板上写)

如果你的工作职位需要考察编程能力的话,那么你需要开始以下的准备工作:

  • 掌握基本的算法以及数据结构和算法复杂度。

  • 练习在白板或记事本上编码,熟悉这种感觉。

  • 练习的时候给自己定时,以免面试时因有时间限制而过度紧张。

  • 如果没有太多软件工程经验,可以找精通的朋友帮忙。

面试时:

确保你完全理解题目意思,不清楚的地方要提前问面试官。样式写代码前,先将方法告诉面试官,让他们可以对你的设计提出优化建议,从而节省时间。除非面试官提出,不要写到一半去检查无效输出。一般情况下,面试官不会在意这个。写完代码后,注意检查一下变量初始化、结束条件和边界情况。

7.了解和应用机器学习理论

有的数据科学家职位对机器学习知识有一定的要求。

机器学习理论将测试你对基本机器学习概念的理解,一般侧重于监督式学习。

对于机器学习理论,你应该了解:

  • 监督式学习系统的一般设置
  • 为什么要将数据分为测试集和训练集
  • 如果根据样本数据不能找到普遍规律,那么该怎么办?(参考答案:用不同的样本数据或者投射到更高的维度空间)如果样本数据太多太杂该怎么办?(参考答案:对其进行正规化)

此外,面试官也可能考察你的应用机器学习的能力。通常,面试官会让你想一个算法实现一个预测类的题。

比如:怎么找出可以推荐给用户的书?

回答此类问题,要明确:

  • 对象是什么?

  • 可以用的机器学习算法有哪些?

  • 内容列表样式

  • 根据问题的定义,对不同的可能情况扩展更多的解决方案,问题就迎刃而解了。

    欢迎关注我的微信公众号:九章算法(ninechapter)。
    精英程序员交流社区,定期发布面试题、面试技巧、求职信息等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值