python的统计库_python统计函数库scipy.stats的用法

最新推荐文章于 2024-09-08 08:06:01 发布

weixin_39967812

最新推荐文章于 2024-09-08 08:06:01 发布

阅读量248

点赞数

文章标签： python的统计库

背景

总结统计工作中几个常用用法在python统计函数库scipy.stats的使用范例。

正态分布

以正态分布的常见需求为例了解scipy.stats的基本使用方法。

1.生成服从指定分布的随机数

norm.rvs通过loc和scale参数可以指定随机变量的偏移和缩放参数，这里对应的是正态分布的期望和标准差。size得到随机数数组的形状参数。(也可以使用np.random.normal(loc=0.0, scale=1.0, size=None))

In [4]: import numpy as np

In [5]: import scipy.stats as st

In [6]: st.norm.rvs(loc = 0,scale = 0.1,size =10)

Out[6]:

array([ 0.12259875, 0.07001414, 0.11296181, -0.00630321, -0.04377487,

0.00474487, -0.00728678, 0.03860256, 0.06701367, 0.03797084])

In [7]:

In [9]: st.norm.rvs(loc = 3,scale = 10,size=(2,2))

Out[9]:

array([[-13.26078265, 0.88411923],

[ 5.14734849, 17.94093177]])

In [10]:

2.求概率密度函数指定点的函数值

stats.norm.pdf正态分布概率密度函数。

In [33]: st.norm.pdf(0,loc = 0,scale = 1)

Out[33]: 0.3989422804014327

In [34]: st.norm.pdf(np.arange(3),loc = 0,scale = 1)

Out[34]: array([ 0.39894228, 0.24197072, 0.05399097])

In [35]:

3.求累计分布函数指定点的函数值

stats.norm.cdf正态分布累计概率密度函数。

In [52]: st.norm.cdf(0,loc=3,scale=1)

Out[52]: 0.0013498980316300933

In [53]: st.norm.cdf(0,0,1)

Out[53]: 0.5

In [54]:

4.累计分布函数的逆函数

stats.norm.ppf正态分布的累计分布函数的逆函数，即下分位点。

In [59]: z05 = st.norm.ppf(0.05)

In [60]:

In [60]: z05

Out[60]: -1.6448536269514729

In [61]: st.norm.cdf(z05)

Out[61]: 0.049999999999999975

In [62]:

通用函数

stats连续型随机变量的公共方法：

名称

备注

rvs

产生服从指定分布的随机数

pdf

概率密度函数

cdf

累计分布函数

残存函数(1-CDF)

ppf

分位点函数(CDF的逆)

isf

逆残存函数(sf的逆)

fit

对一组随机取样进行拟合，最大似然估计方法找出最适合取样数据的概率密度函数系数。

*离散分布的简单方法大多数与连续分布很类似，但是pdf被更换为密度函数pmf。

常见分布

可能用到的分布对照表

名称

含义

beta

beta分布

F分布

gamma

gam分布

poisson

泊松分布

hypergeom

超几何分布

lognorm

对数正态分布

binom

二项分布

uniform

均匀分布

chi2

卡方分布

cauchy

柯西分布

laplace

拉普拉斯分布

rayleigh

瑞利分布

学生T分布

norm

正态分布

expon

指数分布

weixin_39967812

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫