007数据分析能力:概率、数学

假设检验

基本原理:全称命题不能被证明为真,但是可以被证伪。
如果我们需要验证一个假设,将它设置为备择假设,它的相反命题作为原假设,认为我们研究的假设的发生是小概率事件。如果可以推翻原假设,说明小概率事件发生了。

t检验

样本的均值是否存在显著差异
参考1!!!
样本需要取自能够假设为正态分布的样本(检验正态分布:PP图看分布,偏度、峰度检验,偏度峰度联合检验法(Jarque-Bera),K-S检验)。

F检验

  1. F检验是检验两个正态分布的样本的方差是否存在显著差异
  2. 对多组样本之间比较

正定与半正定矩阵

考虑矩阵的特征值。
若所有特征值均不小于零,则称为半正定。
若所有特征值均大于零,则称为正定。

评估离散性的指标

  1. 方差与标准差、平均差
  2. 极差、四分位差
  3. 变异系数(又称“离散系数”(英文:coefficient of variation),是概率分布离散程度的一个归一化量度,其定义为标准差与平均值之比):用于对比两个变量,去量纲了。在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除

假定一枚硬币抛出落地后,正面及反面出现的概率分别为1/2,那么抛10次和抛100次硬币(分别称为P10和P100)相比,以下正确的说法是:

P100出现正面多于反面的概率比P10出现正面多于反面的概率大
P100正面次数的方差小于P10出现正面次数的方差
P100出现连续10次以上正面的概率约为1%
P100前10次都是正面的概率比P10前10次都是正面的可能性大

一堆硬币,一个机器人,如果是反的就翻正,如果是正的就抛掷一次,无穷多次后,求 正反的比例()

3:1
2:1
4:1
6:1

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值