多次见到,今天特此记录下!
期望最大化算法是基于质心得一个聚类算法,它依赖于距离的某种度量,通常是欧几里得距离。
如果预先指定了簇数n,则首先从随机选择n个记录作为n个簇的质心开始。数据集中的每个记录都分配给它最近的质心,因此分配给它的质心代表的簇。在下一轮中,每个质心都移动到属于该群集的所有记录的均值的位置。同样,每个记录都分配给它最近的质心,因此也分配给相应的簇。重复此过程,直到基于所有点到质心的平方距离的某种误差测量值降至某个阈值以下。
现在,每个记录已分配给一个群集。 k均值的变化不仅估计每个聚类的平均值,而且将每个聚类建模为高斯核,同时也估计方差。这既是期望最大化算法 的基本思想了。
期望最大化算法
最新推荐文章于 2024-07-30 07:30:00 发布