太厉害了！这篇文章全面介绍了Python的DBScan集群算法，阿里蚂蚁金服五面

2024spring

于 2024-03-21 16:58:05 发布

阅读量250

点赞数 5

分类专栏： 2024年程序员学习文章标签： python 算法开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_83620959/article/details/136913919

版权

2024年程序员学习专栏收录该内容

294 篇文章 0 订阅

订阅专栏

使用pandas的read方法读取数据集。

导入数据

dataset = pd.read_csv(‘Mall_Customers.csv’)

X = dataset.iloc[:, [3, 4]].values

数据集的视图。

太厉害！这篇文章全面介绍了Python的DBScan集群算法

从sklearn导入聚类算法

from sklearn.cluster import DBSCAN

dbscan=DBSCAN(eps=3,min_samples=4)

现在，拟合模型。

model=dbscan.fit(X)

labels=model.labels_

print(labels)

太厉害！这篇文章全面介绍了Python的DBScan集群算法

我们看到标签也显示“ -1”值，这意味着它是一个离群值，即不属于任何聚类。提出核心要点。

sample_cores=np.zeros_like(labels,dtype=bool)

sample_cores[dbscan.core_sample_indices_]=True

查找簇数

n_clusters=len(set(labels))- (1 if -1 in labels else 0)

print(n_clusters)

#output:

9

上面的代码显示了群集总数。打印群集的分数

最后

🍅 硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。
🍅 面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。
🍅 知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。

小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数初中级Python工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助，可以添加下面V无偿领取！（备注：python）

面经、学习笔记、源码讲义、实战项目、讲解视频**

如果你觉得这些内容对你有帮助，可以添加下面V无偿领取！（备注：python）
[外链图片转存中…(img-LYNzuwcT-1711011475899)]

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
太厉害了！这篇文章全面介绍了Python的DBScan集群算法，阿里蚂蚁金服五面

🍅 硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。🍅 技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。🍅 面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。🍅 知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。