跟我学算法聚类(DBSCAN)

最新推荐文章于 2023-02-21 12:22:09 发布

weixin_34056162

最新推荐文章于 2023-02-21 12:22:09 发布

阅读量95

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/my-love-is-python/p/9530948.html

版权

DBSCAN 是一种基于密度的分类方法

若一个点的密度达到算法设定的阖值则其为核心点（即R领域内点的数量不小于minPts）

所以对于DBSCAN需要设定的参数为两个半径和minPts

我们以一个啤酒的分类指标来做
第一步：提取数据，并分配变量

import pandas as pd
beer = pd.read_csv('data.txt', sep=' ')

X = beer[["calories","sodium","alcohol","cost"]]

第二步：构建模型,并做测试，我们使用的r半径为10，最小样本数为2

db = DBSCAN(eps=10, min_samples=2).fit(X)
print(db.labels_)
beer['cluster_db'] = db.labels_

第三步:根据轮廓系数选定参数，我们发现i=18时，轮廓参数最大

for i in range(5, 20):
    print(metrics.silhouette_score(X, DBSCAN(eps=i, min_samples=2).fit(X).labels_)) #X表示数据,DBSCAN(eps=i, min_samples=2).fit(X).labels_)表示分类的结果标签

转载于:https://www.cnblogs.com/my-love-is-python/p/9530948.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34056162

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
跟我学算法聚类(DBSCAN)

DBSCAN 是一种基于密度的分类方法若一个点的密度达到算法设定的阖值则其为核心点（即R领域内点的数量不小于minPts）所以对于DBSCAN需要设定的参数为两个半径和minPts我们以一个啤酒的分类指标来做第一步：提取数据，并分配变量import pandas as pdbeer = pd.read_csv('data.txt', sep=' ')X = beer...
复制链接

扫一扫