DBSCAN聚类

最新推荐文章于 2024-06-03 17:20:08 发布

1289902828

最新推荐文章于 2024-06-03 17:20:08 发布

阅读量519

点赞数

分类专栏： sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44611266/article/details/100763651

版权

sklearn 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

##DBSCAN

import numpy as np
import pandas as pd
from sklearn.cluster import DBSCAN

#1.导入数据
#data = pd.read_csv(’’)

#2.数据预处理
#略，最终生成x_train,x_test

x_train = np.array([[1, 2, 3], [1, 4, 6], [1, 0, 9], [4, 6, 1], [7, 8, 9], [4, 5, 6], [5, 1, 3], [5, 6, 2], [6, 2, 1]])

#3.模型训练
model = DBSCAN(eps=3, min_samples=2)
model.fit(x_train)

#4.模型预测
print(model.labels_)

#参数列表与调参方法
DBSCAN(eps=0.5, min_samples=5, metric=’euclidean’, metric_params=None, algorithm=’auto’, leaf_size=30, p=None, n_jobs=None)

#eps : float, optional
两个样本之间的最大距离，一个被认为是另一个样本的邻域。这不是群集中点的距离的最大界限。这是为您的数据集和距离函数选择适当的最重要的DBSCAN参数。

#min_samples ： int，可选
对于要被视为核心对象的点，邻域中的样本数（或总权重）。这包括点本身。

#metric ： string或callable
计算要素数组中实例之间距离时使用的度量标准。如果metric是字符串或可调用的，则它必须是sklearn.metrics.pairwise_distances其metric metric参数允许的选项之一。
如果度量是“预先计算的”，则假定X是距离矩阵，并且必须是正方形。X可以是稀疏矩阵，在这种情况下，只有“非零”元素可以被认为是DBSCAN的邻居。

#metric_params : dict, optional
度量函数的其他关键字参数。

#algorithm：{‘auto’，‘ball_tree’，‘kd_tree’，‘brute’}，可选
NearestNeighbors模块用于计算逐点距离并找到最近邻居的算法。有关详细信息，请参阅NearestNeighbors模块文档。

#leaf_size ： int，optional（默认值= 30）
叶子大小传递给BallTree或cKDTree。这可能会影响构造和查询的速度，以及存储树所需的内存。最佳值取决于问题的性质。

#p ： float，可选
正确译法：用于计算点之间距离的Minkowski矩阵的幂。

#n_jobs ： int或None，可选（默认=无）
要运行的并行作业数。 None除非在joblib.parallel_backend上下文中，否则表示1 。 -1表示使用所有处理器。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
DBSCAN聚类

##DBSCANimport numpy as npimport pandas as pdfrom sklearn.cluster import DBSCAN#1.导入数据#data = pd.read_csv(’’)#2.数据预处理#略，最终生成x_train,x_testx_train = np.array([[1, 2, 3], [1, 4, 6], [1, 0, 9], [...
复制链接

扫一扫

专栏目录

1289902828

CSDN认证博客专家 CSDN认证企业博客

码龄5年

37: 原创

2万+: 周排名

125万+: 总排名

2万+: 访问

: 等级

441: 积分

15: 粉丝

11: 获赞

11: 评论

66: 收藏

私信

关注

热门文章

分类专栏

数据挖掘 1篇
论文笔记 8篇
Hive 1篇
Linux 3篇
HBase 1篇
机器学习 1篇
sklearn 7篇
MySQL 6篇
matplotlib 1篇
Pandas 3篇
Numpy 5篇

最新评论

论文笔记-时序预测-FEDformer
Chase～711: 请问博主fed给了f和w，但是代码只有一个，怎么区分f和w呢
论文笔记-时序预测-Autoformer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。
论文笔记-时序预测-Pyraformer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。
论文笔记-时序预测-Informer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。
论文笔记-时序预测-Triformer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。