DBSCAN聚类效果不稳定问题

最新推荐文章于 2023-05-21 17:17:05 发布

大臉喵愛吃魚

最新推荐文章于 2023-05-21 17:17:05 发布

阅读量1.8k

点赞数

分类专栏： python 文章标签： python 深度学习

本文链接：https://blog.csdn.net/qq_36638362/article/details/109443755

版权

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

DBSCAN聚类算法含义：

https://blog.csdn.net/lys_828/article/details/108702381

DBSCAN聚类参数主要有这两个：eps 和 min_simples

DBSCAN调参可视化部分：

# 测试调参部分
mask_test1 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)
mask_test2 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)
# 存放各个参数的组合计算出来的模型评估得分和噪声比 # 注意浮点数int计算时末尾为x.99999
for i in tqdm.tqdm(np.arange(0.05, 1.0, 0.05), total=len(np.arange(0.05, 1.0, 0.05))):
    for j in np.arange(50, 1500, 50):
        try:  # 因为不同的参数组合，有可能导致计算得分出错，所以用try
            features = StandardScaler().fit_transform(get_lane_embedding_feats_result['lane_embedding_feats'])
            db = DBSCAN(eps=i, min_samples=j).fit(features)
            labels = db.labels_  # 得到DBSCAN预测的分类便签
            k = metrics.silhouette_score(features, labels)  # 轮廓系数评价聚类的好坏，值越大越好
            raito = len(labels[labels[:] == -1]) / len(labels)  # 计算噪声点个数占总数的比例
            n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)  # 获取分簇的数目
            mask_test1[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = k
            mask_test2[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = raito
        except:
            mask_test1[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = 0.0
            mask_test2[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = 1.0
plt.figure('mask_test1')
plt.imshow(mask_test1 * 255, cmap='gray')
plt.figure('mask_test2')
plt.imshow(mask_test2 * 255, cmap='gray')
plt.show()
plt.pause(5)

在使用训练得到的模型进行测试的过程中，聚类时遇到DBSCAN最优聚类参数不稳定的情况：

左图：轮廓系数评价聚类的好坏，值越大越好右图：计算噪声点个数占总数的比例，值越小越好

分析原因：

测试图未进行统一：将三个测试图统一到统一亮度、色度。代码：https://blog.csdn.net/qq_36638362/article/details/109311353 结果：未使得优化
训练集含有多种不同类型的对象，对应的标签：重新进行标签训练。结果：未使得优化
。。。。。分析中

大臉喵愛吃魚

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
DBSCAN聚类效果不稳定问题

DBSCAN聚类算法含义：https://blog.csdn.net/lys_828/article/details/108702381DBSCAN聚类参数主要有这两个：eps 和 min_simplesDBSCAN调参可视化部分：# 测试调参部分mask_test1 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)mask_test2 = np.zer..
复制链接

扫一扫