高斯混合模型,首先说的那就是高斯分布,
f
(
x
)
=
1
2
π
σ
exp
(
−
(
x
−
μ
)
2
2
σ
2
)
=
N
(
x
,
σ
,
μ
2
)
f(x)=\frac{1}{\sqrt{{2\pi}}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2})=N(x,\sigma,\mu^2)
f(x)=2πσ1exp(−2σ2(x−μ)2)=N(x,σ,μ2)
对应的均值方差是
μ
\mu
μ,
σ
2
\sigma^2
σ2
对于样本空间
X
X
X,有样本数据
x
=
[
x
1
,
x
2
,
x
3
,
x
4
,
.
.
.
,
x
n
]
x=[x_1,x_2,x_3,x_4,...,x_n]
x=[x1,x2,x3,x4,...,xn]
高斯函数可以拟合任意的曲线,在样本是多维特征的情况下
x
⃗
=
[
x
i
⃗
]
\vec{x}=[\vec{x_i}]
x=[xi]。
相应的就会有多元混合高斯分布。
多元的
f
(
x
)
=
∑
m
=
1
M
1
2
π
σ
m
exp
(
−
(
x
−
μ
m
)
2
2
σ
m
2
)
f({x}) = \sum_{m=1}^M{\frac{1}{\sqrt{{2\pi}}\sigma_m}\exp(-\frac{(x-\mu_m)^2}{2\sigma_m^2})}
f(x)=m=1∑M2πσm1exp(−2σm2(x−μm)2)
上面是单变量的混合高斯模型。
在现实生活中将单变量扩展到多变量就会有
f
(
x
⃗
)
=
∑
m
=
1
M
c
m
2
π
D
2
∑
m
⃗
1
2
exp
(
−
1
2
(
x
⃗
−
μ
m
⃗
)
T
∑
m
−
1
(
x
⃗
−
μ
m
⃗
)
)
=
∑
m
=
1
M
c
m
N
(
x
⃗
;
μ
m
⃗
,
∑
m
⃗
)
f(\vec{x}) = \sum_{m=1}^M{\frac{c_m}{{{2\pi}^{\frac{D}{2}}}{\vec{\sum{_m}}}^{\frac{1}{2}}} \exp(-{\frac{1}{2}}({\vec{x}-\vec{\mu_m}})^T{{\sum_m}^{-1}}({\vec{x}-\vec{\mu_m}}))} = \sum_{m=1}^M{{c_m}{N(\vec{x};\vec{\mu_m},\vec{\sum_m})}}
f(x)=m=1∑M2π2D∑m21cmexp(−21(x−μm)Tm∑−1(x−μm))=m=1∑McmN(x;μm,m∑)
参数估计问题,在多变量的高斯混合函数问题中,是用期望最大的方法来估计的,是一个迭代算法。
多变量的高斯混合函数能拟合任何函数。
在语音识别中,多变量的高斯混合函数,是以帧级别来估计每一帧的概率值;特征根据经验值来给定,一般就是特征的维度。
语音识别是一个语音信号序列识别的问题,gmm仅只是一个帧级别的模型;序列模型需要用隐马尔可夫模型来估计状态的序列问题;在状态上,可以用gmm模型来拟合当前状态的数据。
高斯混合模型
最新推荐文章于 2024-07-16 17:56:45 发布