迅速收藏!109个数据科学面试问答,你绝对不能错过的宝藏库!

不管你是拥有上万经验条的“老手”,亦或是初出茅庐却天资过人的“新手”,面试官总能“难倒你”。

在面试的时候,面试官所出题目涉及的范围可能会非常广,这既考验了面试者的技能知识,又很能体现面试者的沟通技巧。面试官会通过一系列的问题来衡量你的数据统计、编程,和数据建模能力,而且这些问题是经过专门设计的,需要你精神高度集中,并迫使你展示在压力下的工作状态。

好的准备工作是数据科学职业生涯成功的关键,这当然也包括面试过程。

怎样才能不被面试官“难倒”?怎样才能在一场数据科学面试上脱颖而出?小芯这次特别整理了你应该准备的所有数据科学面试问题,包括国内外109个面试问答,都是数据科学面试时面试者曾遇到的真实的问题哦,作为年末送给大家的福利~快将它收入囊中吧~

现在,我们将数据科学家将会遇到的面试问题分为了六个不同的类别:数据统计、编程、建模、行为、文化,和解决问题类。

1.  数据统计(Statistics)

2.  编程

3.  一般问题

4.  大数据

5.  Python

6.  R语言

7.  结构化查询语言(SQL)

8.  建模

9.  行为

10.  文化契合

11.  问题解决能力

 

 

数据统计面试问题

统计计算就是数据科学家通过原始数据来做出预测和建模的过程。没有杰出的统计学知识,是很难成为一个成功的数据科学家的。因此,一个优秀的面试官大概率会通过一些统计向的数据科学问题,来试探你对这个领域的理解。那么面试者最好对一些基本的统计问题有所准备,以此为数据面试做更充分的准备。

下列是我们搜寻到的一些常见统计问题:

1.  什么是中心极限定理?它为什么很重要?

○  “假设,我们有兴趣来估算所有人的平均身高。搜集世界上每个人的数据是不可能的。虽然我们不能获得每个人的身高测量数据,但我们仍可以从一些人身上取样。那么问题就变成了,对于这个单一的样本推测出的整个人口的平均身高,你的看法是怎么样的。中心极限定理其实也就是在讨论这个问题。”

2.  什么是抽样? 你知道多少种抽样方法?

○  “数据抽样是一种统计分析技术,用于选择、操作和分析具有代表性的数据点子集,以识别正在测试的更大数据集中的模式和趋势。”

3.  I类错误和II类型错误的区别是什么?

○  “当原假设为真但被拒绝时,会发生I类错误。如果原假设是不成立的,但却错误地没有被拒绝,就会发生 II 类错误。

4.  什么是线性回归?P 值、系数、和R平方值这些术语又是什么意思?它们各自的重要性又是怎样的?

○  线性回归是快速预测分析的好工具。举例来讲,房子的价格取决于许多因素,比如它的大小或位置。为了看到这些变量之间的关系,我们需要建立一个线性回归模型,它可以预测变量之间的最佳匹配线,并且可以帮助得出这两个因素之间是正相关还是负相关。

5.  线性回归需要什么样的假设?

○  有四个主要假设: 1. 因变量和回归变量之间存在线性关系,这意味着你正在创建的模型实际上适合数据。2. 数据的误差或残差是正态分布的,相互独立。3. 在解释变量间存在最小多重共线性。4. 同方差性。这意味着对于预测变量的所有值,回归线周围的方差是相同的。

6.  什么是统计交互作用?   

○  “基本上,交互作用是指一个因素(输入变量)对因变量(输出变量)的影响在另一个因素的不同水平上存在差异。”

7.  什么是选择性偏差?  

○  “当为建模而收集和准备的样本数据具有不能代表模型将预测到的未来真实情况的特征时,选择(或‘抽样’)偏差会在‘主动的’意义上发生。也就是说,当一部分数据被系统地,即非随机地排除在分析之外时,就会出现主动选择性偏差。”     

8.  非高斯分布的数据集是什么样的?     

○  “高斯分布是指数族分布的一部分,但除此之外,还有很多使用十分便捷的分布。对研究深度学习的人而言,如果在统计学方面有坚实的基础,则能够更加熟练地应用这些分布。

9.  二项式概率公式是什么?

○  “二项分布的概率包括:n次独立试验中每次成功的可能数量的概率,每次试验都发生的概率(希腊字母 pi)。”

在Glassdoor*上找到的类似的数据科学面试问题实例:

*Glassdoor 是美国一家做企业点评与职位搜索的职场社区。

 

什么是P值?如果有不同(更大,有三百万个期望值)的数据集你又如何理解P值变化?

 

Wayfair*公司(一家美国电子商务公司,主要销售家具和家居用品。)决定不再向过半的线上客户

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值