笔记 | gamma分布

gamma分布简介

大写:Γ

小写:γ

Gamma 函数在概率统计中频繁现身,众多的统计分布,包括常见的统计学三大分布(t 分布,χ2 分布,F分布)、Beta分布、 Dirichlet 分布的密度公式中都有 Gamma 函数的身影;当然发生最直接联系的概率分布是直接由 Gamma 函数变换得到的 Gamma 分布。

d4c0ad8e629cb5629a236d710e7d145b.png

α 称为 shape parameter, 主要决定了分布曲线的形状;

β 称为rate parameter,主要决定曲线有多陡。

θ=1/β称为scale parameter,同样决定曲线有多陡。

固定α =4,可以看到随着θ参数的增加,x轴的scale在增加,其分布相对就越广。若放在同一个x轴上,增加θ将得到更平缓的曲线(相应地,y轴的scale减小)。

cad3b686064be28bd5fb940823c7b7d9.gif

固定α=4,随着β参数的增加,x轴的scale在减小,其分布相对就越窄。若放在同一个x轴上,增加β将得到更陡的曲线(相应地,y轴的scale增加)。

6f81576b5e42152b23af1bf947bd5f9e.gif

最后,固定β=1,α改变,曲线的形态发生改变

96b6c820fcf631088a3d61f68bd499db.gif

gamma相关函数

这几个R中的函数d-/p-/q-/r-,把gamma换成binom就成了binomial分布相关的计算,换成norm就成了normal分布的计算。gamma的函数,你不一定能用上,但是norm相关的几个函数肯定是会用得到的。

# 概率密度函数值 pdf
# 算的是某一个点上的概率密度。
dgamma(x, shape, rate = 1, scale = 1/rate, log = FALSE)
# 概率分布函数值 cdf 累积概率
pgamma(q, shape, rate = 1, scale = 1/rate, lower.tail = TRUE,
       log.p = FALSE)
# 概率分位函数值
qgamma(p, shape, rate = 1, scale = 1/rate, lower.tail = TRUE,
       log.p = FALSE)
# 产生服从伽马分布的随机数
rgamma(n, shape, rate = 1, scale = 1/rate)

pdf和cdf

cf8b2e06d40b25912fac6ede1b4cc8e2.png

pgamma给定一个值计算累计概率

R: pgamma(5,10,1,lower.tail = T)

Matlab: gamcdf(5,10,1)

[1] 0.03182806

4ff48377faffbade753f982a838551c8.png

R: pgamma(5,10,1,lower.tail = F)

Matlab: gamcdf(5,10,1,'upper')

[1] 0.9681719

1e53879e6c5f41fed8491f48b4822a39.png

qgamma给定累计概率计算对应的值(相当于找cutoff)

R: qgamma(0.3,10, lower.tail=T)

Matlab: gaminv(0.3,10,1)

[1] 8.132928

44e856c13eac24e8b143ad9ec216a565.png

R: qgamma(0.3,10, lower.tail=F)

Matlab: gaminv(0.7,10,1)

[1] 11.38727

fd3900a7caf0c7472a415d808a19f909.png

gamma和inverse gamma

set.seed(1)
1/rgamma(n=1, shape=10,scale=1/2)
[1] 0.2608497


set.seed(1)
rinvgamma(n=1, shape=10,scale=2)
[1] 0.2608497

invser gamma分布就是gamma分布的倒数(reciprocal)。更准确的说如果x服从gamma(a,b),则y=1/x服从inverse-gamma(a,1/b)。其实知道它们的关系是很重要的,因为有的时候用的不是方差,而是precision(方差的倒数)作为分布的参数。

什么是reciprocal

74c704305b4583f2941f65e8d894487e.png

gamma分布的应用

gamma/inverse-gamma分布在Bayesian Inference中使用比较广泛。无论是empirical Bayes还是基于MCMC采样的后验分布计算,它主要作为非负实数的先验分布(比如方差)出现。在empricial Bayesian的计算中,gamma分布是正态似然函数的共轭先验,因此有关的后验分布可以不做MCMC,直接根据公式计算。

5a996bd78f44c44c18c93dc591e8a24f.png

例如在方差未知的条件下,我们假设方差来自gamma分布。

下面的例子是方差和均值都未知的情况,假设总体的均值来自于Norm(μ0, σ0^2),总体的方差来自于gamma(α, β)。

755df6c7972a7d5e5afb252f0c3da14e.png

dfe53e0d93babbe3ed8a2ed193a2a5b6.png

后验分布为:

fa79dc847ac2a46e89e8d4260cf6dd1b.png

当然很多情况下是无法产生像上面一样的解,因此需要做MCMC采样,gamma/inverse-gamma分布也经常作为未知参数(比如,方差)的先验分布

(附赠一份先验选择速查表)

070ee3e0dd9a64f8c81db2a1022a7009.png

btw, SPM默认的HRF就是用两个gamma函数生成的

spm_hrf.mspm_Gpdf.m

e4cb99cefa02f4dd3a009d9c883c0832.png

7980940c2c1c401d7f4406cca7491f45.png

3cf1a7230cb867bb0b2ee468315de491.png

—END—

Recap:

  • gamma分布的参数及作用

  • dgamma/qgamma/pgamma/rgamma函数的用法

  • gamma分布的应用

bc7d53863f7bbaa91dacff7b2fff2e65.gif

  • 10
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值