均匀分布
离散
假设X有K个取值 x 1 , x 2 , . . . , x K x_1, x_2, ..., x_K x1,x2,...,xK,概率密度函数为如下公式:
P ( X = x i ) = 1 K i = 1 , 2 , . . . , K P(X=x_i)=\frac{1}{K} \quad i = 1, 2, ..., K P(X=xi)=K1i=1,2,...,K
连续
x在
[
a
,
b
]
[a,b]
[a,b]上的概率密度函数为如下公式:
{
1
b
−
a
if
a
≤
x
≤
b
0
otherwise
\begin{cases} \frac{1}{b-a} & \text{ if } a \leq x \leq b \\ 0 & \text{ otherwise } \end{cases}
{b−a10 if a≤x≤b otherwise
伯努利分布
参数为p,随机变量x的取值为{0, 1},概率密度函数为如下公式,类似于抛一次硬币正面朝上的概率,期望为p,方差为p(1-p)。
f ( x ) = p x ( 1 − p ) ( 1 − x ) f(x)=p^x(1-p)^{(1-x)} f(x)=px(1−p)(1−x)
二项分布
参数为p,随机变量x的取值为{0, 1},实验重复n次成功x次的概率为如下公式,期望为np,方差为np(1-p)。
f ( x ) = C n x p x ( 1 − p ) ( 1 − x ) f(x)=C_n^x p^x(1-p)^{(1-x)} f(x)=Cnxpx(1−p)(1−x)
正太分布
随机抽中数值类特征x的具体取值的概率密度函数为:
f ( x ) = 1 2 π σ e − ( x − μ ) 2 / 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi} \sigma}e^{-(x-\mu)^2/2\sigma^2} f(x)=2πσ1e−(x−μ)2/2σ2
中心极限定理:对于若干个独立同分布的变量 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn,其加和的平均值服从正太分布,其核心思想是抽样组数多到一定程度上统计出的数值接近整体数值,具体可以见这里。
beta分布
x的概率密度函数为:
f ( x ; α , β ) = x α − 1 ( 1 − x ) β − 1 ∫ 0 1 u α − 1 ( 1 − u ) β − 1 d u f(x;\alpha, \beta)=\frac{x^{\alpha-1}(1-x)^{\beta-1}}{\int_{0}^{1}u^{\alpha-1}(1-u)^{\beta-1}du} f(x;α,β)=∫01uα−1(1−u)β−1duxα−1(1−x)β−1