Task03:常见分布与假设检验

 

一、基本概念

随机变量:根据随机变量可能取值的个数分为离散型(取值有限)和连续型(取值无限)两类。对于离散型随机变量,使用概率质量函数(probability mass function),简称PMF,来描述其分布律。对于连续型随机变量,使用概率密度函数(probability density function),简称PDF,来描述其分布情况。对于连续型随机变量,通常还会用到累积分布函数 (cumulative distribution function),简称CDF,来描述其性质,在数学上CDF是PDF的积分形式。

PDF:概率密度函数(probability density function),在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

PMF : 概率质量函数(probability mass function),在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

1.1 离散型分布

二项分布(Binomial distribution):一种只有两种结果(成功/失败)的单次试验重复多次后成功次数的分布概率。

泊松分布(Poisson distribution):用来描述泊松试验的一种分布

  满足以下两个特征的试验可以认为是泊松试验:

  • 所考察的事件在任意两个长度相等的区间里发生一次的机会均等
  • 所考察的事件在任何一个区间里发生与否和在其他区间里发生与否没有相互影响,即是独立的

  泊松分布需要满足一些条件:

  • 试验次数n趋向于无穷大
  • 单次事件发生的概率p趋向于0
  • np是一个有限的数值 

其他不常用离散型分布:

几何分布(Geometric distribution):考虑独立重复试验,几何分布描述的是经过k次试验才首次获得成功的概率

负二项分布(Negative binomial distribution):考虑独立重复试验,负二项分布描述的是试验一直进行到成功r次的概率

超几何分布(Hypergeometric Distribution):超几何分布描述的是在一个总数为N的总体中进行有放回地抽样

1.2 连续型分布

均匀分布 (Uniform distribution):是一类在定义域内概率密度函数处处相等的统计分布。

正态分布 (Normal distribution):也叫做高斯分布,是最为常见的统计分布之一,是一种对称的分布,概率密度呈现钟摆的形状,其中μ为正态分布的均值,σ为正态分布的标准差

指数分布 (Exponential distribution):通常被广泛用在描述一个特定事件发生所需要的时间,在指数分布随机变量的分布中,有着很少的大数值和非常多的小数值。其中λ被称为率参数(r

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值