sklearn构建K-means聚类模型以及使用FMI,轮廓系数法,Calinski-Harabasz评价模型

本文介绍了如何使用sklearn构建K-means聚类模型,并通过FMI、轮廓系数法和Calinski-Harabasz指数对模型进行评价。以iris数据集为例,展示了模型的构建过程,并通过可视化手段查看聚类效果。
摘要由CSDN通过智能技术生成

聚类分析是在没给定划分类别的情况下,根据数据相似度进行样本划分的一种方法,属于非监督学习。

(1)使用sklearn估计器构建聚类模型

聚类算法实现需要估计器,sklearn估计器有fit和predict两个方法:

fit: 主要用于训练算法,该方法可接收用于有监督学习的训练集及其标签两个参数,也可接收无监督学习的数据。

predict:用于有监督学习的测试集标签,也可用于划分传入数据的类别。

以iris数据为例,构建K-means聚类模型

from sklearn.datasets import load_iris          #从datasets加载iris数据     
from sklearn.preprocessing import MinMaxScaler  #从preprocessing加载离差标准化模块
from sklearn.cluster import KMeans              #从cluster加载k均值聚类模块

iris=load_iris()                                
iris_data=iris['data']                          #提取数据集的特征
iris_target=iris['target']                      #提取数据集的标签
iris_names=iris['feature_names']                #提取特征名

s
  • 6
    点赞
  • 81
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值