scikit-learn笔记----使用距离向量构建模型

本文详细介绍了使用scikit-learn库进行数据聚类的方法,包括KMeans和MiniBatch KMeans,特别是在处理大量数据和图像量化方面的应用。此外,还探讨了KNN(K最近邻)算法在回归任务中的使用。
摘要由CSDN通过智能技术生成

1. KMeans 对数据聚类

from sklearn.datasets import make_blobs
blobs, classes = make_blobs(500, centers=3)

from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3)
kmeans.fit(blobs)

import matplotlib.pyplot as plt
import numpy as np
% matplotlib inline
f, ax = plt.subplots(figsize=(7.5, 7.5))
rgb = np.array(['r', 'g', 'b'])
ax.scatter(blobs[:, 0], blobs[:, 1], color=rgb[classes])
ax.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='*', s=250, color='black', label='Centers')
ax.set_title('Blobs')
f.show()

labels_ 属性会产生每个点的预期标签
>>> kmean.labels_[:5]
array([1, 1, 2, 2, 1], dtype=int32)
transform 函数十分有用,它会输出每个点到形心的距离

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值