二项分布 | 泊松分布 | 指数分布 | 负二项分布 | 伽玛分布 | Βeta分布 | 卡方分布 | 正态分布 | 多维高斯分布 | 狄利克雷分布 | 帕累托分布 | 柯西分布 | 持续收集~...

这篇博客深入探讨了一系列重要的概率分布,包括泊松、指数、二项、负二项、伽玛、βeta、卡方、正态和多维高斯分布。文章强调理解每个分布的应用场景和特性,如泊松分布用于描述单位时间内随机事件发生的次数,二项分布关注独立事件的成功次数,负二项分布则涉及失败次数。此外,博客还提到了高斯分布和多维高斯分布在数据分析中的重要性,并介绍了帕累托和柯西分布的相关概念。
摘要由CSDN通过智能技术生成

Poisson Distribution | Gamma distribution | beta distribution | chi-square distribution

2018年04月04日

再谈泊松分布:

一直感觉学统计学太难了,各种分布,傻傻搞不清,就算是现在弄清楚了,以后再实战中见到这个分布的时候还是懵逼。

基本概念所有统计分布都是用于描述事件发生概率的,所有事件发生概率之和为1,也就是所有概率分布的面积(积分)为1.

泊松分布,也是老早就接触的分布,到现在也没真正搞清楚。

其实我太过于纠结泊松分布的公式,其实只要不是数学统计学方向的人,根本就不需要知道泊松分布的公式是怎么来的!!!完全不用在意这个公式!!!

你只需要泊松分布是用于描述什么实际问题的就好了。

泊松分布,“描述单位时间内随机事件发生的次数的概率分布”,前提是我们知道某段时间内时间发生的平均值。比如我们在观察通过学校大门的人的数量,假设我们已经知道10min内平均通过5人。那么我们就能知道10min内通过1人的概率。怎么知道,直接带入公式即可,泊松分布唯一的一个参数就是入,它就是我们的平均值。

至于这个公式是怎么来的,作为模型应用者,我们完全不需要知道。

应用前提:每个人(每个事件)的发生是相互独立的。(如果总有一些人是同时出现得,那么就不独立,就不能用泊松分布了。)

泊松分布的现实意义是什么,为什么现实生活多数服从于泊松分布?

再举例:如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、激光的光子数分布等等。(万变不离其中:事件单位事件内发生的次数的概率)

泊松分布性质:数学期望与方差相等,同为参数λ:E(X)=V(X)=λ

在RNA-seq中,技术误差是满足泊松分布的,因为期望和方差差不多。但是生物学重复之间的误差不能用泊松分布来描述,因为他的方差可能很大,所以要用负二项分布,加了一个额外的误差项。

 


 

再谈二项分布:

二项分布也是学烂了,闭着眼睛都能想到抛硬币问题。

二项分布(英语:Binomial distribution)是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布。

当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布。因此参数为λ = np的泊松分布可以作为二项分布B(n, p)的近似,如果n足够大,而p足够小。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值