聚类分析

通俗的讲,聚类分析它是根据研究对象的特征按照一定的标准,对研究对象来进行分类的一种分析方法,它使分成后的每一种类的数据对象具有较高的相似度,而不同类的对象有比较大的差异性,聚类分析可以在没有明显分类的情况下,对所给数据进行分类。
纯概念可能不是很好理解,下面用一个python的例子做一个比较形象的展示,

Python实现Kmeans聚类代码
import numpy as np \支持大量的维度数组与矩阵运算,支持大量的维度数组与矩阵运算
import matplotlib.pyplot as plt \Matplotlib是Python的绘图库,其中的pyplot包封装了很多画图的函数。Matplotlib.pyplot 包含一系列类似 MATLAB 中绘图函数的相关函数。
from sklearn.cluster import MiniBatchKMeans,KMeans\Mini Batch K-Means算法是K-Means算法的一种优化变种,采用小规模的数据子集(每次训练使用的数据集是在训练算法的时候随机抽取的数据子集)减少计算时间,同时试图优化目标函数;Mini Batch K-Means算法可以减少K-Means算法的收敛时间,而且产生的结果效果只是略差于标准K-Means算法
from sklearn import metrics\利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个库。
from sklearn.datasets.samples_generator import make_blobs\聚类数据生成器,常被用来生成聚类算法的测试数据
X,y=make_blobs(n_samples=1000,n_features=2,
centers=[[-1,-1],[0,0],[1,1],[2,2]],

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值