python 计算概率密度、累计分布、逆函数

心态与习惯

已于 2023-09-13 17:57:28 修改

阅读量2.1w

点赞数 8

分类专栏：统计学/机器学习 Python 文章标签： python 概率密度累计分布逆函数 scipy

于 2019-12-03 22:54:53 首次发布

本文链接：https://blog.csdn.net/robert_chen1988/article/details/103378284

版权

Python 同时被 2 个专栏收录

58 篇文章 31 订阅

订阅专栏

统计学/机器学习

54 篇文章 34 订阅

订阅专栏

计算概率分布的相关参数时，一般使用 scipy 包，常用的函数包括以下几个：

pdf：连续随机分布的概率密度函数
pmf：离散随机分布的概率密度函数
cdf：累计分布函数
ppf: 百分位函数（累计分布函数的逆函数）
lsf: 生存函数的逆函数（1 - cdf 的逆函数）

函数里面不仅能跟一个数据，还能跟一个数组。下面用正态分布举例说明：

>>> import scipy.stats as st

>>> st.norm.cdf(0) # 标准正态分布在 0 处的累计分布概率值
0.5

>>> st.norm.cdf([-1, 0, 1])# 标准正态分布分别在 -1， 0， 1 处的累计分布概率值
array([0.15865525, 0.5, 0.84134475])

>>> st.norm.pdf(0) # 标准正态分布在 0 处的概率密度值
0.3989422804014327

>>> st.norm.ppf(0.975)# 标准正态分布在 0.975 处的逆函数值
1.959963984540054

>>> st.norm.lsf(0.975)# 标准正态分布在 0.025 处的生存函数的逆函数值
1.959963984540054

对于非标准正态分布，通过更改参数 loc 与 scale 来改变均值与标准差：

>>> st.norm.cdf(0, loc=2, scale=1) # 均值为 2，标准差为 1 的正态分布在 0 处的累计分布概率值
0.022750131948179195

对于其他随机分布，可能更改的参数不一样，具体需要查官方文档。下面我们举一些常用分布的例子：

>>> st.binom.pmf(4, n=100, p=0.05) # 参数值 n=100, p=0.05 的二项分布在 4 处的概率密度值
0.17814264156968956

>>> st.geom.pmf(4, p=0.05) # 参数值 p=0.05 的几何分布在 4 处的概率密度值
0.04286875

>>> st.poisson.pmf(2, mu=3) # 参数值 mu=3 的泊松分布在 2 处的概率密度值
0.22404180765538775

>>> st.chi2.ppf(0.95, df=10) # 自由度为 10 的卡方分布在 0.95 处的逆函数值
18.307038053275146

>>> st.t.ppf(0.975, df=10) # 自由度为 10 的 t 分布在 0.975 处的逆函数值
2.2281388519649385

>>> st.f.ppf(0.95, dfn=2, dfd=12) # 自由度为 2, 12 的 F 分布在 0.95 处的逆函数值
3.8852938346523933

心态与习惯

关注

8
点赞
踩
80

收藏

觉得还不错? 一键收藏
打赏
11
评论
python 计算概率密度、累计分布、逆函数

计算概率分布的相关参数时，一般使用 scipy 包，常用的函数包括以下几个：pdf：连续随机分布的概率密度函数pmf：离散随机分布的概率密度函数cdf：累计分布函数百分位函数（累计分布函数的逆函数）生存函数的逆函数（1 - cdf 的逆函数）函数里面不仅能跟一个数据，还能跟一个数组。下面用正态分布举例说明：>>> import scipy.stats as st...
复制链接

扫一扫