聚类算法

聚类算法有很多种(几十种),K-Means是聚类算法中的最常用的一种,算法最大的特点是简单,好理解,运算速度快,但是只能应用于连续型的数据,并且一定要在聚类前需要手工指定要分成几类。俗话说“物以类聚”,其实从广义上说,聚类就是将数据集中在某些方面相似的数据成员放在一起。一个聚类就是一些数据实例的集合,其中处于相同聚类中的数据元素彼此相似,但是处于不同聚类中的元素彼此不同。由于在聚类中那些表示数据类别的分类或分组信息是没有的,即这些数据是没有标签的,所有聚类及时通常被成为无监督学习(Unsupervised Learning)。

使用案例:(读取excel文件并将数据分成五种类别)

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
f = open('100个地点.csv')
res = pd.read_csv(f,index_col='index',parse_dates=True)
#data.head(3)
#输出x1,y1数据集
X = data[['x1','y1']]

print(X)

from sklearn.cluster import KMeans  
clf = KMeans(n_clusters=5)  #
y_pred = clf.fit_predict(X) # 

#输出完整Kmeans函数,包括很多省略参数  
print(clf)  
#输出聚类预测结果,聚成5类,类标为0、1、2、3、4 
print(y_pred) 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值