机器学习_K-Means

Sklearn实现K-Means

import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
import scipy.io
from sklearn.cluster imoprt KMeans

导入数据

def loaddata():
	data = np.loadtxt('data/cluster_data.csv',delimiter=',')
	return data
X = loaddata()

fit模型

model = KMeans(n_cluster=3,max_iter=10)
model.fit(X)

print('聚类中心:',model.cluster_centers_)
print('每个样本所属的簇:', model.labesl_)

# 画图
cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
plt.scatter(X[:, 0], X[:, 1], c=model.labels_, cmap=cm_dark, s=20)
plt.scatter(model.cluster_centers[:, 0], model.cluster_centers_[:, 1], c=np.arange(len(model.cluster_centers_)))

层次聚类实现

from sklearn.cluster import AgglomerativeClustering

linkage可取值:

  • ward:最小方差
  • complete:最大距离
  • average:平均距离
  • single:最小距离
model = AgglomerativeClustering(n_clusters=3,affinity='euclidean',linkage='complete')
print('每个样本所属的簇:',model.labels_)

# 画图
cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
plt.scatter(X[:, 0], X[:, 1], c=model.labels_, cmap=cm_dark, s=20)
plt.show()

密度聚类

根据密度聚类的过程,无需设置聚类个数

from sklearn.cluster import DBSCAN

def loaddata():
	data = np.loadtxt('data/cluster_data.csv',delimiter=',')
	return data
X = loaddata()
model = DBSCAN(eps=0.5, min_samples=5, metric='euclidean')
model.fit(X)
print('每个样本所属的簇', model.labels_)

画图

cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b', 'c'])
plt.scatter(X[:,0], X[:,1], c=model.labels_, cmap=cm_dark, s=20)
plt.show()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值