使用pandas的read方法读取数据集。
导入数据
dataset = pd.read_csv(‘Mall_Customers.csv’)
X = dataset.iloc[:, [3, 4]].values
数据集的视图。
从sklearn导入聚类算法
from sklearn.cluster import DBSCAN
dbscan=DBSCAN(eps=3,min_samples=4)
现在,拟合模型。
model=dbscan.fit(X)
labels=model.labels_
print(labels)
我们看到标签也显示“ -1”值,这意味着它是一个离群值,即不属于任何聚类。提出核心要点。
sample_cores=np.zeros_like(labels,dtype=bool)
sample_cores[dbscan.core_sample_indices_]=True
查找簇数
n_clusters=len(set(labels))- (1 if -1 in labels else 0)
print(n_clusters)
#output:
9
上面的代码显示了群集总数。打印群集的分数
最后
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。
小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
面经、学习笔记、源码讲义、实战项目、讲解视频**
如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
[外链图片转存中…(img-LYNzuwcT-1711011475899)]