python进行聚类分析:鸢尾花(iris)代码
基本信息
在无监督学习中,数据不带任何标签。能找出数据内在分类规则,并分成独立的点集(蔟),算法称为聚类算法。
本文主要利用经典的鸢尾花(iris)来实现python的简单的聚类分析。
代码实现
基础函数
# 导入库
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets
import time
from sklearn import metrics
import matplotlib as mpl
## 导入数据
iris = datasets.load_iris()
X = iris.data[:, :4] # #表示我们取特征空间中的4个维度
Y = iris.target
print(X.shape)
## 定义基本函数
def get_HT(X,Y,label_pred,name='k_means'):
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
x0 = X[label_pred == 0]
x1 = X[label_pred == 1]
x2 = X[label_pred == 2]
plt.scatter(x0[:, 0], x0[:, 1], c="red", marker='o', label='簇1')
plt.scatter(x1[:, 0], x1[:, 1], c="green", marker='*', label='簇2')
plt.scatter(x2[