作者:George Seif
编译:Bot
编者按:聚类是一种涉及数据点分组的机器学习技术。给定一组数据点,我们可以使用聚类算法将每个数据点到分类到图像中的特定组中。理论上,同一组中的数据点应具有相似的属性和特征,而不同组中的数据点的属性和特征则应高度不同。聚类是无监督学习的一种方法,是用于多领域统计数据分析的常用技术。
在数据科学中,我们可以通过聚类分析观察使用聚类算法后这些数据点分别落入了哪个组,并从中获得一些有价值的信息。那么今天,我们就跟着机器学习工程师George Seif来看看数据科学家需要掌握的5种实用聚类算法以及它们的优缺点。
有幸在B站上看到了某Up主强烈推荐的知乎专栏
数据科学家需要知道的5种聚类算法
讲得十分透彻易懂。致敬大神