聚类分析学习笔记(二)
此笔记参考了数据挖掘导论、周志华的机器学习以及机器学习实战三本书
3.基于密度的聚类
3.1 基本概念
簇是对象的稠密区域,被低密度环绕,此类算法假设聚类结构能通过样本分布的紧凑程度确定。当簇不规则或互相盘绕,并且有噪声和离群点时,常常使用基于密度的簇定义。通常情况下,密度聚类算法从样本密度来考察样本之间的可连接性,再基于样本之间的可连接性不断扩展簇最后得到聚类结果。
(1) ε 邻域:给定对象半径 ε 内的区域称为该对象的 ε
此笔记参考了数据挖掘导论、周志华的机器学习以及机器学习实战三本书
簇是对象的稠密区域,被低密度环绕,此类算法假设聚类结构能通过样本分布的紧凑程度确定。当簇不规则或互相盘绕,并且有噪声和离群点时,常常使用基于密度的簇定义。通常情况下,密度聚类算法从样本密度来考察样本之间的可连接性,再基于样本之间的可连接性不断扩展簇最后得到聚类结果。
(1) ε 邻域:给定对象半径 ε 内的区域称为该对象的 ε