聚类
文章平均质量分 93
Jender_Sean
这个作者很懒,什么都没留下…
展开
-
层次聚类AGNES与DIANA
1. AGNESAGNES是一种采用自底向上合并策略的聚类算法,其思想为:初始将所有样本看成一个簇,然后在每一轮过程中将距离最近的两个簇合并为一个簇,簇的个数不断减少到人为指定的聚类簇数K,终止算法。该算法关键在于如何度量两个簇的距离,集合间的距离计算有如下方式:最小距离:dist(Ci,Cj)=min[x∈Ci,z∈Cj]∣∣x−z∣∣2最大距离:dist(Ci,Cj)=max[x∈Ci,z∈Cj]∣∣x−z∣∣2平均距离:dist(Ci,Cj)=1∣Ci∣∣Cj∣∑x∈Ci∑z∈Cj∣∣x−z∣∣2原创 2021-07-29 17:23:41 · 1496 阅读 · 0 评论 -
密度聚类DBSCAN
1.相关概念DBSCAN是基于密度的聚类算法,该类算法假设聚类结构能够通过样本分布的紧密程度确定(样本密度均匀分布),它通常考虑的是样本之间的可连接性,并以最大连接性确定聚类簇。要搞懂该算法,首先要理清楚几个概念:邻域:对于样本xi∈Dx_i \in Dxi∈D,其邻域包含样本集D中距离xix_ixi不超过ϵ\epsilonϵ的样本,即Nϵ(xi)={xj∈D∣dist(xi,xj)≤ϵ}N_\epsilon(x_i)=\{x_j \in D | dist(x_i,x_j) \leq \epsil原创 2021-07-27 11:55:02 · 295 阅读 · 0 评论 -
K-means及其改进
一. k-means1.算法流程给定数据样本集D={x1,x2,...,xm}D=\{x_1,x_2,...,x_m\}D={x1,x2,...,xm},k-means欲将DDD划分成K个簇C={c1,c2,...,ck}C=\{c_1,c_2,...,c_k\}C={c1,c2,...,ck}并且簇之间没有交集。其目标是最小化平方误差和:E=∑i=1k∑x∈ci∣∣x−ui∣∣22\begin{aligned}E=\sum_{i=1}^k\sum_{x\in c_i}||x-u_i|原创 2021-07-19 15:51:12 · 2200 阅读 · 1 评论