# 聚类任务
聚类是将数据集中的样本划分为若干个互不相交的子集,每个子集称为一个”簇“。
需要注意的是:聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握命名。
聚类既能作为一个单独过程,用于寻找数据内在的分布式结构,也可以作为分类其他学习任务的前驱过程。
# 聚类的种类
聚类按照聚类方法分为原型聚类、密度聚类和层次聚类三种。
## 原型聚类
原型聚类亦称”基于原型的聚类“,此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中极为常用。
通常情况下,算法先对原型进行初始化,然后对原型进行迭代更新求解。
### k均值算法
该算法