聚类是典型的无监督学习算法,常见的包括K均值聚类、均值偏移聚类、密度聚类、高斯混合聚类、层次聚类。通过本次课,理解这五种聚类算法的原理和各自的优缺点,并能编码实现K均值聚类算法。通过实验观察影响算法性能的因素,并对算法进行改进,能读懂二分K均值聚类代码,并能手工推演二分K均值聚类过程。上次课介绍了几种范数距离的意义,本次课进一步理解余弦距离的意义。
聚类是典型的无监督学习算法,常见的包括K均值聚类、均值偏移聚类、密度聚类、高斯混合聚类、层次聚类。通过本次课,理解这五种聚类算法的原理和各自的优缺点,并能编码实现K均值聚类算法。通过实验观察影响算法性能的因素,并对算法进行改进,能读懂二分K均值聚类代码,并能手工推演二分K均值聚类过程。上次课介绍了几种范数距离的意义,本次课进一步理解余弦距离的意义。