太厉害了!这篇文章全面介绍了Python的DBScan集群算法,阿里蚂蚁金服五面

使用pandas的read方法读取数据集。

导入数据

dataset = pd.read_csv(‘Mall_Customers.csv’)

X = dataset.iloc[:, [3, 4]].values

数据集的视图。

太厉害!这篇文章全面介绍了Python的DBScan集群算法

从sklearn导入聚类算法

from sklearn.cluster import DBSCAN

dbscan=DBSCAN(eps=3,min_samples=4)

现在,拟合模型。

model=dbscan.fit(X)

labels=model.labels_

print(labels)

太厉害!这篇文章全面介绍了Python的DBScan集群算法

我们看到标签也显示“ -1”值,这意味着它是一个离群值,即不属于任何聚类。提出核心要点。

sample_cores=np.zeros_like(labels,dtype=bool)

sample_cores[dbscan.core_sample_indices_]=True

查找簇数

n_clusters=len(set(labels))- (1 if -1 in labels else 0)

print(n_clusters)

#output:

9

上面的代码显示了群集总数。打印群集的分数

最后

🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。

小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
img

面经、学习笔记、源码讲义、实战项目、讲解视频**

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
[外链图片转存中…(img-LYNzuwcT-1711011475899)]

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值