Hisun_Gwen-CSDN博客

原创聚类（Clustering）理论简介

聚类(clustering)是将数据集D划分成若干互不相交的子集，即’簇’（cluster）.通常这个数据集是由无标记（也可以是少部分存在标记）的样本数据构成。它的核心思想是“物以类聚”。现实中，人们获得的数据大部分都是未标记，分类和回归算法不能够处理这些数据，而人工进行标记耗时耗力，也是不可行的。因此，人们处理这些数据的大致步骤是：先采用聚类，将数据划分成若干个簇，再将每个簇根据数据的含义定义

2017-06-06 16:58:22 1638

原创利用sklearn.cluster实现k均值聚类

一、k-mean算法介绍 1.主要思想:在给定聚类簇数（K值）【n_clusters】和K个初始类簇中心（通常从数据集中随机选取k个数据）的情况下，历遍数据集中的每个数据点，而数据点距离哪个类簇中心（cluster centers）最近，就把该数据点分配到这个类簇中心点所代表的类簇中；所有数据点分配完毕之后，根据类簇内的所有点重新计算每个类簇的中心点(取平均值)，然后再迭代的进行分配点

2017-06-06 16:22:17 14526 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 聚类（Clustering）理论简介

原创 利用sklearn.cluster实现k均值聚类

空空如也

空空如也

原创聚类（Clustering）理论简介

原创利用sklearn.cluster实现k均值聚类