scipy.stats
scipy.stats 是 scipy 专门用于统计的函数库,所有的统计函数都位于子包 scipy.stats 中,可以使用 scipy.info(scipy.stats) 函数获得这些函数的完整列表。该模块包含大量的概率分以及不断增长的统计函数库。每一个单变量的分布都是以下三个类的子类的实例:
类 | 说明 |
---|---|
rv_continuous | 用于子类化的通用连续随机变量类 |
rv_discrete | 用于子类化的通用离散随机变量类 |
rv_histogram | 生成由直方图给出的分布 |
更多参见 scipy.stats
1. uniform
uniform = scipy.stats.uniform(loc=0, scale=1)
均匀分布,属于连续性概率分布函数,默认为 [0, 1] 的均匀分布。使用参数 loc 和 scale 确定均匀分布的范围为 [loc, loc + scale]。
Methods:
methods | description |
---|---|
rvs(loc=0, scale=1, size=1, random_state=None) | Random variates |
pdf(x, loc=0, scale=1) | Probability density dunction |
cdf(x, loc=0, scale=1) | Cumulative distribution function |
ppf(q,loc=0,scale=1) | Percent point function |
stats(loc=0, scale=1, moments=‘mv’) | Mean(‘m’), variance(‘v’), skew(‘s’), and/or kurtosis(‘k’) |
fit(data) | fit model, get distribution parameters |
interval(alpha, loc=0, scale=1) | Endpoints of the range that contains alpha percent of the distribution |
median(loc=0, scale=1) | Median of the distribution |
mean,var, std | mean, variance , standard deviation |
更多查看uniform
2. norm
norm = scipy.stats.norm(loc=0, scale=1)
正态分布,属于连续性概率分布函数, loc 表示均值,scale 表示标准差。其概率密度函数为 f ( x ) = 1 2 π ∗ s c a l e exp ( − ( x − l o c ) 2 2 ∗ s c a l e 2 ) f(x)=\frac{1}{\sqrt{2\pi}*scale}\exp{\left(-\frac{(x-loc)^2}{2*scale^2} \right)} f(x)=2π∗scale1exp(−2∗scale2(x−loc)2)更多查看 norm
3. multivariate_normal
mul_norm = scipy.stats.multivariate_normal(mean=None, cov=1, allow_singular=False, seed=None)
多变量的正态分布,其概率密度函数为 f ( x ) = 1 ( 2 π ) k det Σ exp ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f(x)=\frac{1}{\sqrt{(2\pi)^k\det\Sigma}}\exp{\left(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu) \right)} f(x)=(2π)kdetΣ1exp(−21(x−μ)TΣ−1(x−μ))更多查看 multivariate_normal
4. poisson
poisson = scipy.stats.poisson(k, mu, loc)
泊松分布,属于离散型概率分布函数, 其概率质量函数为 f ( k ) = μ k exp ( − μ ) k ! . . . f o r k ≥ 0 f(k)=\frac{\mu^k\exp(-\mu)}{k!}\ \ \ ...\ for \ \ k\ge 0 f(k)=k!μkexp(−μ) ... for k≥0有 poisson.pmf(k, mu, loc) 等效于 poisson.pmf(k - loc, mu)。
poisson.pmf(x) 中的 pmf 是 probability mass function 的意思,相对于连续概率分布中的 probability density function,更多参考 poisson
5. pearsonr
r, p_value = pearsonr(x, y)
pearson 相关性系数, 相关性函数。其计算公式为:
r
=
∑
(
x
−
m
x
)
(
y
−
m
y
)
∑
(
x
−
m
x
)
2
∑
(
y
−
m
y
)
2
r=\frac{\sum(x-m_x)(y-m_y)}{\sqrt{\sum(x-m_x)^2\sum(y-m_y)^2 }}
r=∑(x−mx)2∑(y−my)2∑(x−mx)(y−my)
6. spearmanr
r, pvalue = scipy.stats.spearmanr(x,y)
spearmanr 相关性系数,相关性函数