![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Hisun_Gwen
这个作者很懒,什么都没留下…
展开
-
聚类(Clustering)理论简介
聚类(clustering)是将数据集D划分成若干互不相交的子集,即’簇’(cluster).通常这个数据集是由无标记(也可以是少部分存在标记)的样本数据构成。它的核心思想是“物以类聚”。 现实中,人们获得的数据大部分都是未标记,分类和回归算法不能够处理这些数据,而人工进行标记耗时耗力,也是不可行的。因此,人们处理这些数据的大致步骤是:先采用聚类,将数据划分成若干个簇,再将每个簇根据数据的含义定义原创 2017-06-06 16:58:22 · 1599 阅读 · 0 评论 -
利用sklearn.cluster实现k均值聚类
一、k-mean算法介绍 1.主要思想:在给定聚类簇数(K值)【n_clusters】和K个初始类簇中心(通常从数据集中随机选取k个数据)的情况下,历遍数据集中的每个数据点,而数据点距离哪个类簇中心(cluster centers)最近,就把该数据点分配到这个类簇中心点所代表的类簇中;所有数据点分配完毕之后,根据类簇内的所有点重新计算每个类簇的中心点(取平均值),然后再迭代的进行分配点原创 2017-06-06 16:22:17 · 14477 阅读 · 1 评论