总结:
Dirichlet Process Mixture(DPM)是一个聚类方法,可以实现聚类个数的自适应确定。DPM被称为非参数贝叶斯聚类,是因为它与其他聚类方法不同,不需要指定需要聚类的个数。
具体的理论,本文没有深入。
比较好的参考文献:
Dirichlet Process (DP)被称为分布的分布。从DP抽取出的每个样本(一个函数)都可以被认为是一个离散随机变量的分布函数,这个随机变量以非零概率值在可数无穷个离散点上取值。
Dirichlet Process Mixture (DPM)是这种非参数贝叶斯聚类模型中的一个典型代表。DPM可以认为是有限混合(Finite Mixture,FM)模型的一个推广,FM(如Gaussian Mixture模型)必须首先给定类数,而DPM则不需要,它可以依据数据自行判断类数。理论上来说,DPM的类数随着log(样本点数量)的增长速度增长。
参考:
Dirichlet Process 和 Dirichlet Process Mixture模型 - BreezeDeus - 博客园