Statistics Basis

1.Conditional Probabilities

(the probability of A given B, '' means AND, '|' means given)


2.Bayes' Theorem(贝叶斯


e.g.

Selects one of the volunteers at random toask if she enjoyed playing the game, and she says she did. Given that the volunteer enjoyedplaying the game, what’s the probability that she played game 2?

P(Game2|Satisfied) = 0.2 x 0.7 / (0.2 x 0.7 + 0.8 x0.6) = 0.226


3.Independent(独立)

P(AB) = P(A)P(B)

If events A and B are independent, then theprobability of event A is unaffected by event B. i.e.P(A | B) = P(A)

4. Variance(方差)


5. Regression Line(一元线性回归)

y = a + bx(a为截距、偏置(bias))


6. Least Square(最小二乘方)

求回归系数,拟合方法 – 最小二乘估计:


7. 密度函数、分布函数


(F(x)是累积分布函数,即分布函数)

8. 分布

8.1.二项分布

贝努里试验:只有二个结果(如success和failure)的最简单试验

N重贝努里试验:贝努里试验独立重复n次,对应分布为二项分布

b(n,p), (q=1-p)

e.g. 一位射手打靶命中率为0.9,现进行6次打靶,则至少命中5次的概率为:


8.2.正态分布

标准正态分布N(0,1)

9. 矩

原点矩:,一阶原点矩即期望

中心矩:,二阶中心矩即方差

10. 偏差、协方差、相关系数

偏差:X-EX

协方差:Cov(X,Y) =E[(X-EX)(Y-EY)] = E(XY) – EXEY

相关系数: ,= 0即不相关


11. 假设检验

Terms

Sample

原假设、备择假设

原H,备H1

检验统计量

Ex,H: Ex = 8,H1: Ex > 8

临界值c

X > c,拒绝H;X < c,保留H

拒绝域W、接受域A

假设H被拒绝的样本值集合为拒绝域

显著性水平a

“H为真但被错误拒绝”的概率,如0.05

参数检验、非参数检验

参数检验:总体分布已知,对参数假设检验

单边、双边检验

拒绝域W={x>=c}单边,W={x<=c1或x>=c2}双边


12. 估计区间

参数的真实值有一定概率(即置信水平)落在结果范围(置信区间)。

e.g. 大选中某人的支持率,置信水平0.95上的置信区间(Confidence interval)是(50%,60%),支持率有百分之九十五的机率落在百分之五十和百分之六十之间。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值