Python+sklearn使用DBSCAN聚类算法案例一则

DBSCAN聚类算法概述:

  • DBSCAN属于密度聚类算法,把类定义为密度相连对象的最大集合,通过在样本空间中不断搜索最大集合完成聚类。

  • DBSCAN能够在带有噪点的样本空间中发现任意形状的聚类并排除噪点。

  • DBSCAN算法不需要预先指定聚类数量,但对用户设定的参数非常敏感。

  • 当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差。

DBSCAN算法基本概念:

  • 核心对象:如果给定对象的半径eps邻域内样本数量超过阈值min_samples,则称为核心对象。

  • 边界对象:在半径eps内点的数量小于min_samples,但是落在核心点的邻域内。

  • 噪声对象:既不是核心对象也不是边界对象的样本。

  • 直接密度可达:如果对象q在核心对象p的eps邻域内,则称q从p出发是直接密度可达的。

  • 密度可达:集合中的对象链p1、p2、p3、...、pn,如果每个对象pi+1从pi出发都是直接密度可达的,则称pn从p1出发是密度可达的。

  • 密度相连:集合中如果存在对象o使得对象p和q从o出发都是密度可达的,则称对象p和q是互相密度相连的。

DBSCAN聚类算法工作过程:

1)定义邻域半径eps和样本数量阈值min_samples。
2)从样本空间中抽取一个尚未访问过的样本p。
3)如果样本p是核心对象,进入第4)步;否则返回第2)步。
4)找出样本p出发的所有密度可达对象,构成一个聚类Cp(该聚类的边界对象都是非核心对象),并标记这些对象为已访问。
5)如果全部样本都已访问,算法结束;否则返回第2)步。

Python+sklearn使用DBSCAN聚类算法参考代码:

聚类结果图一:

聚类结果图二:

聚类结果图三:

----------相关阅读----------

1900页Python系列PPT分享一:基础知识(106页)

1900页Python系列PPT分享二:Python序列(列表、元组、字典、集合)(154页)

1900页Python系列PPT分享三:选择与循环结构语法及案例(96页)

1900页Python系列PPT分享四:字符串与正则表达式(109页)

1900页Python系列PPT分享五:函数设计与应用(134页)

1900页Python系列PPT分享六:面向对象程序设计(86页)

1900页Python系列PPT分享七:文件操作(132页)

报告PPT(163页):基于Python语言的课程群建设探讨与实践

Python使用系统聚类方法进行数据分类案例一则

Python使用K-means聚类算法进行分类案例一则

KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类

Python+sklearn使用线性回归算法预测儿童身高

使用线性回归拟合平面最佳直线及预测之Python+sklearn实现

Python使用系统聚类算法对随机元素进行分类

Python+KNN算法判断单词相似度小案例

Python+tensorflow计算整数阶乘的方法与局限性

Python编写的数字拼图游戏(含爬山算法人机对战功能)

详解Python使用模拟退火算法求解列表“最大值”

Python使用爬山算法寻找序列“最大值”

Python使用tensorflow中梯度下降算法求解变量最优值

Python+pandas实现时间序列数据扩展案例一则

Python+pandas+matplotlib数据分析与可视化案例(附源码)

几行Python代码生成饭店营业额模拟数据并保存为CSV文件

Python+pandas计算数据相关系数

两行Python代码实现电影打分与推荐

Python绘制时间序列数据的时序图、自相关图和偏自相关图

Python使用pandas对数据进行差分运算

Python使用pandas扩展库DataFrame对象的pivot方法对数据进行透视转换

Python使用pandas读取Excel文件数据和预处理小案例

使用Python内置集合对象和内置函数filter()过滤无效书评

Python数据分析扩展库pandas的DataFrame排序方法小结

Pandas创建DataFrame对象的几种常用方法

Python基于用户协同过滤算法的电影推荐代码demo

又一个学期结束了,送给在校大学生几句话

淡定!不要因为纳入了高考和二级考试甚至极个别小学课程就盲目夸大Python!

全国计算机等级考试二级Python考试大纲预测和分析

大家都在学Python,你和别人的差距在哪?

大学生们颤抖吧,中学生已经开始学Python了!

祝所有程序员1024节日快乐

学会提问,你就成功了一大半!

盘点那些让人上火的提问方式(论如何让交流更高效)

----------喜大普奔----------

1、董付国老师Python系列教材:

《Python程序设计基础》

《Python程序设计(第2版)》

《Python可以这样学》(本书已被引入台湾发行繁体版)

《Python程序设计开发宝典》

《中学生可以这样学Python》

董付国老师6本Python系列图书阅读指南

董付国老师6本Python系列教材被北大、复旦等近百所高校选作教材

热烈庆祝《Python可以这样学》在台湾发行繁体版

2、董老师免费视频地址: https://pan.baidu.com/s/1jJeAs8Q 密码: px59

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

dongfuguo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值