机器学习 sklearn 无监督学习聚类算法 K-means

最新推荐文章于 2024-07-07 22:27:26 发布

404detective

最新推荐文章于 2024-07-07 22:27:26 发布

阅读量932

点赞数 4

分类专栏：机器学习sklearn—调参笔记文章标签：机器学习 python 聚类算法 sklearn 数据挖掘

本文链接：https://blog.csdn.net/qq_26230027/article/details/119741453

版权

机器学习sklearn—调参笔记专栏收录该内容

11 篇文章 10 订阅

订阅专栏

在这里插入图片描述

import matplotlib.pyplot as plt
from sklearn.datasets.samples_generator import make_blobs
from sklearn.cluster import KMeans

# 生成测试数据
# X为样本特征，Y为样本簇类别，共1000个样本，每个样本2个特征，对应x和y轴，共4个簇，
# 簇中心在[-1,-1], [0,0],[1,1], [2,2]， 簇方差分别为[0.4, 0.2, 0.2]
X, y = make_blobs(n_samples=1000, n_features=2 , centers=[[-1, -1], [0, 0], [1, 1], [2, 2]],
                  cluster_std=[0.4, 0.2, 0.2, 0.2], random_state=10)
#默认max_iter=300
y_pred = KMeans(n_clusters=4).fit_predict(X)

plt.figure(figsize=(12, 6))  
plt.subplot(121)
plt.xlim((-3,3))
plt.ylim((-3,3))
plt.xlabel('X1')
plt.ylabel('X2')
plt.scatter(X[:, 0], X[:, 1], c=y_pred)

plt.subplot(122)
plt.xlim((-3,3))
plt.ylim((-3,3))
plt.xlabel('X1')
plt.ylabel('X2')
plt.scatter(X[:, 0], X[:, 1], c=y)

plt.show()

cluster_std=[0.7, 0.7, 0.7, 0.7]
在这里插入图片描述
cluster_std=[0.7, 0.7, 0.7, 0.7]

应用

在这里插入图片描述

from sklearn.cluster import KMeans
import sklearn

def loadData(filePath):
    fr = open(filePath,'r+')
    lines = fr.readlines()
    retData = []
    retCityName = []
    for line in lines:
        items = line.strip().split(",")
        retCityName.append(items[0])
        retData.append([float(items[i])
    for i in range(1 ,len(items))])
    return retData,retCityName

data,city=loadData("E:\Desktop\python_code\sklearn\课程数据\聚类\city.txt")

y_pred = KMeans(n_clusters=4).fit_predict(data)

CityCluster = [[],[],[],[]]
for i in range(len(city)):
    CityCluster[y_pred[i]].append(city[i])
for i in range(len(CityCluster)):
    print(CityCluster[i])

运行多次北上广总在一类
在这里插入图片描述

404detective

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
机器学习 sklearn 无监督学习聚类算法 K-means

import matplotlib.pyplot as pltfrom sklearn.datasets.samples_generator import make_blobsfrom sklearn.cluster import KMeans# 生成测试数据# X为样本特征，Y为样本簇类别，共1000个样本，每个样本2个特征，对应x和y轴，共4个簇，# 簇中心在[-1,-1], [0,0],[1,1], [2,2]，簇方差分别为[0.4, 0.2, 0.2]X, y = make_bl..
复制链接

扫一扫