数分面试题-统计学

1、如何理解假设检验中的P值和显著性检验水平阿尔法?

学着举例说明
遇到一个男生追求,有两个假设:
H0:男生真心爱你
H1:男生不是真心爱你
如果男生真心爱你,H0成立但是你拒绝了H0,犯了第一类错误,阿尔法错误,弃真错误
如果男生不是真心爱你,而你接受了男生的追求,犯了第二类错误,取伪错误
犯第一类错误与第二类错误的概率往往此消彼长,你小我大,你大我小,基于保护原假设的原则,我们通常会先固定第一类错误,让第一类错误不超过某阈值(也就是阿尔法值),即“显著性水平阿尔法”,代表好人被冤枉的最大概率
阿尔法越大,表示检验越松懈,冤枉好人的概率越大

P值是当原假设为真时所得到的样本观察结果或者更极端结果出现的概率。如果P值很小,说明在原假设下极端观测结果的发生概率很小,而如果出现了,根据小概率原理,就有理由拒绝原假设,P值越小,拒绝原假设的理由越充分。

阿尔法值是每次检验前人为规定的,当做出拒绝原假设的决定时,其犯错的可能性不超过这个人为设定的值。
而P值是计算出来的概率。当P值小于阿尔法时,可能发生的误差小于了允许的最大误差,拒绝原假设。

2、如何理解置信度与置信水平?

置信区间是对这个样本的某个总体参数的区间估计,置信区间展示的是这个参数的真实值有一定的概率落在测量结果的周围的程度。
这个一定概率就是置信度。

3、极大似然估计?

利用已知的样本结果,反推最有可能导致这样结果的参数值。
利用已知的样本结果信息,反推最大概率导致这些样本结果出现的模型参数值

4、介绍一种非参数统计方法,并叙述优缺点

非参数统计:对总体的分布不作假设或仅作非常一般性假设条件下的统计方法
机器学习:决策树、随机森林、SVM
假设检验:符号,符号秩,秩和检验
优点:
非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛
多数非参数统计方法要求的思想与运算比较简单,可以迅速完成计算取得结果
缺点:
由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用,就不如参数统计方法敏感。

5、如何理解过拟合,如何防止过拟合

学习如何识别图像中的一只狗,如果是只要有两个眼睛就是欠拟合,如果是必须毛发多长眼睛多大才被认为是一条狗,则是过拟合

如何防止过拟合?
交叉比对,在这张图片上学到的特征,去另一张图片上测试,再换到下一张图片上测试。
来来回回用不同的测试对象和训练对象做交叉对比,这样学到的规律就不会过拟合了

6、男生点击率增加,女生点击率增加,总体为何减少?

因为男女的点击率可能有较大差异,同时低点击率群体的占比增大
如原本男性20人,1人点击,女性100人,99人点击。总点击率100/120
现在男生100人,6人点击,女性20人,20人点击。总点击率26/120
如:“A系中智商最低的人去读B,同时提高了A系与B系的平均智商”

7、参数估计与假设检验

参数估计与假设检验的两个组成部分,都是利用样本对总体进行推断,但推断的角度不同。
参数估计:用样本估计总体参数的方法,总体参数U在估计前是未知的
假设检验:先对U提出一个假设,利用样本信息去检验这个假设是否成立。

8、协方差与相关系数的区别与联系

协方差:两个变量总体的误差
相关系数:两个变量之间线性相关程度的量,取值[-1,1],相关系数也是一种协方差,剔除了两个变量量纲影响、标准化后的特殊协方差。

9、中心极限定理

定义:任何一个样本的平均值将会约等于其所在总体的平均值
不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的平均值周围,并且呈正态分布

在许多情况下,对于独立并同样分布的随机变量,即使原始变量本身不是正态分布,标准化样本均值的抽样分布也趋向于标准正态分布.

10、时间序列分析

是同一现象在不同时间上的相继观察值排列而成的序列

11、如何直观简单的解释正态分布

拿出班级的成绩表,每隔2分统计一下人数,画出钟形。说这是正态分布,大多数人集中在中间,只有少数特别好和不够好的

12、主成分分析

原理:设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的统计方法

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值