scipy.stats —— 概率、随机变量与分布

import numpy as np
import scipy.stats as st
  • 几率(odds)

    p ( B ) = 1 20 p(B)=\frac1{20} p(B)=201:二十场比赛只赢一场
    **odds against B winning: ** o ( B ) = 1 − p ( B ) p ( B ) = 19 o(B)=\frac{1-p(B)}{p(B)}=19 o(B)=p(B)1p(B)=19
    A赢19场比赛,B才会赢一场

0. 常见分布

  • 泊松分布:st.poisson(lambda)
  • 指数分布:st.expon
  • 二项分布:st.binom(n, p)
  • 正态分布:st.norm
    • 默认为标准正态分布,st.norm().cdf(0) ⇒ 0.5
    • st.norm(32, 2.5).cdf(32) ⇒0.5,均值为 32;
  • beta分布:st.beta
  • gamma分布:st.gamma

1. scipy.stats vs. scipy.special

  • scipy.special:中定义的是一些特殊的函数;
    • scipy.special.beta:表示的是beta函数;
    • scipy.special.gamma:表示的则是 gamma 函数
  • scipy.stats:定义的则是概率分布;
    • scipy.stats.beta:表示的是 beta 分布;
    • scipy.stats.gamma:表示的是 gamma 分布;

2. 创建随机变量(rv:random variable)

  • 泊松分布

    F_true = 1000
    N = 50
    F = st.poisson(F_true).rvs(N)
    				# 泊松分布为离散型概率分布
    

    也可以这样:

    mu_true, sigma_true = 1000, 15
    N = 100
    F_true = st.norm(mu_true, sigma_true).rvs(N)
    F = st.poisson(F_true).rvs()
    
  • 二项分布

    # python
    >>> import scipy.stats as st
    >>> n, p = 100, .5
    >>> X = st.binom(n, p)
    						# 随机变量X:投100次硬币正面出现的个数
    						# 用二项分布表示
    >>> X.mean()
    50.0						# mu = n*p = 100*.5 
    >>> X.std()
    5.0							# sigma = sqrt(n*p*q)=sqrt(100*.5*.5)
    

    st.binom(100, .5).rvs() ⇒ 采样(trial);

3. 连续性概率分布函数:pdf

pdf 表示的是函数,给一定输入值,就会得到一个输出值,而不是随机变量。

  • st.norm.pdf(0, loc=0, scale=1) ⇒ 1 2 π \frac1{\sqrt{2\pi}} 2π 1

    如下代码绘制出 f ( x ) = 1 2 π exp ⁡ ( − ( x − 1 ) 2 2 ) f(x)=\frac1{\sqrt{2\pi}}\exp(-\frac{(x-1)^2}{2}) f(x)=2π 1exp(2(x1)2)

    mu, sigma = 1, 1
    xs = np.linspace(-5, 5, 1000)
    plt.plot(x, st.norm.pdf(xs, loc=mu, scale=sigma))
    plt.show()
    
  • st.multivariate_normal:多元正态分布;
    scipy.stats.multivariate_normal

    • 直接传递 x x x,根据概率密度函数(pdf)获得其值;
    x = np.linspace(0, 5, 10, endpoint=False)
    y = st.multivariate_normal.pdf(x, mean=2.5, cov=.5)
    
    • 首先定义随机变量,再取得 pdf 在各个位置上的值;
    x, y = np.mgrid[-1:1:.01, -1:1:.01]
    pos = np.empty(x.shape + (2,))
    pos[:, :, 0] = x; pos[:, :, 1] = y
    rv = multivariate_normal([0, 0], [[1, 0], [0, 1]])
    plt.contourf(x, y, rv.pdf(pos))
    
  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值