目录
聚类
聚类属于无监督学习问题,目标是将样本分成多个类别,保证类别内样本之间相似度高,类别间样本之间差异性高,这些类被称之为簇(cluster)。聚类是分类问题,它的目标是确定每个样本归属的类别,与有监督分类算法(比如SVM支持向量机)相比,这里的样本的类别初始是不知道的,而是通过聚类确定,但是类别个数可以人工设定。假设有一个样本集,含有个样本,如下:
目录
聚类属于无监督学习问题,目标是将样本分成多个类别,保证类别内样本之间相似度高,类别间样本之间差异性高,这些类被称之为簇(cluster)。聚类是分类问题,它的目标是确定每个样本归属的类别,与有监督分类算法(比如SVM支持向量机)相比,这里的样本的类别初始是不知道的,而是通过聚类确定,但是类别个数可以人工设定。假设有一个样本集,含有个样本,如下: