DBScan+iris数据集实现+参数调节

本文记录了使用DBScan在iris数据集上进行聚类的实践过程,发现初始参数设定无法得到理想的三个类别。尝试通过参数调节方法优化,包括基于k-距离的散点图分析来确定Eps值,但仍未能达到预期效果。文章最后提到这种方法在寻找拐点方面的不明显,并表示将进一步研究。
摘要由CSDN通过智能技术生成

关于DBScan的理论就不再黏贴了,这里记录一个讲的比较详细的网站 : https://www.cnblogs.com/pinard/p/6208966.html
下午尝试着用iris数据集去测试一下, 但发现效果不太理想,后面又用比较简单的参数调节方法去调参数,似乎也不理想,这里把记录下来以供后面继续研究。

  1. Load data from iris.csv
import pandas as pd
import numpy as np
import math
import operator
import matplotlib.pyplot as plt
from sklearn.cluster import DBSCAN

data = pd.read_csv("iris.csv")
data = np.mat(data)
  1. Use sklearn.DBSCAN to do the clustering
y_pred = DBSCAN(eps=0.5, min_samples=5).fit_predict(data[:, 1:5])

  1. Show the result
colors = 'gbycm'
y_pred_color = []
category = []
for pred in y_pred:
    if pred == -1:
        color = 'r'
    else:
        color = colors[pred]
    y_pred_color.appe
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值