【机器学习】机器学习实验六:聚类算法(详细代码展示)

文章探讨了K-means、层次聚类、DBSCAN和密度峰值聚类(DPC)的基本原理,并在鸢尾花数据集上进行了实验。通过兰德系数和轮廓系数评估了四种算法的性能。此外,研究了k、eps、min_samples和t0等关键参数对算法的影响,并在不同数据集上进行了参数敏感性分析。
摘要由CSDN通过智能技术生成

一、实验介绍

1.1 简单介绍

简单介绍K-means、层次聚类,DBSCAN 和密度峰值聚类(DPC)算法的原理

1.2 鸢尾花数据实验

  • 对鸢尾花数据集进行探索性分析与预处理
  • 选取兰德系数和轮廓系数作为评价指标,对四种算法在该数据集上的性能进行分析

1.3 算法参数影响探究

  • 介绍三种算法中的几个主要参数(K-Means 中的 k 参数、DBSCAN 中的 eps 与 min_samples 参数、DPC 中的t0参数–t0 的含义为圆中样本个数占数据集总样本数的比例)
  • 以鸢尾花数据为例,选取合适的评价指标,探究 K-Means 算法中 k 参数对算法的性能影响,并尝试找出确定 k 参数的方法
  • 以模拟数据为例(如:高斯分布数据集,Spiral 数据集,Circle数据集),选取合适的评价指标,探究另外三个参数(eps与min_samples、t0)对各自算法的性能影响

二、项目地址

https://mbd.pub/o/bread/ZJaZk5ps

在这里插入图片描述

三、算法结果展示

  1. 绘制原始分布图

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值