聚类模型
文章平均质量分 64
cyoutetsu
这个作者很懒,什么都没留下…
展开
-
K-Means算法
K-MEANS算法K-MEANS算法用质心定义原型,其中质心是一组点的均值。算法步骤1.随机选择K个点作为初始质心这是一种常见的选择质心的方法,但是簇的质量常常很差取一个样本,并使用层次聚类技术对它聚类,从层次聚类中提取K个簇,并用这些簇的质心作为初始质心随机地选择第一个点,或取所有点的质心作为第一个点,选择离已经选取过的初始质心最远的点作为一个个后续的初始质心二分K均值使用后处理来修补所产原创 2017-09-17 14:55:40 · 659 阅读 · 0 评论 -
DBSCAN聚类
DBSCAN聚类首先需要说明的是,密度的定义为在给定半径范围内样本点的数量。算法步骤标记对于每一个样本点,在其周边的给定半径的范围内,其余样本点的数量不小于指定的数量的话,这个样本点就是核心点(core point)如果小于指定的最小值,但是其半径范围内有核心点的话,这个点就是边界点(border point)剩下的点称为噪声点(noise point)划分每个核心点或者距离相近的几个核心原创 2017-09-25 11:53:31 · 421 阅读 · 0 评论 -
KNN算法
K近邻模型目的:规定一个训练数据集,对新输入的实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某一个类,就把该输入的实例分配给这个类。模型的三要素距离的度量:一般常用的是欧式距离,也有Lp距离等等K值得选择分类决策规则的决定距离的度量LpL_p距离:Lp(xi,xj)=[∑|x(l)i−x(l)j|p]1pL_p(x_i,x_j)=\left[\sum|x_i^{(l)原创 2017-09-17 14:26:32 · 368 阅读 · 0 评论 -
聚类分析框架
优化目标聚类分析仅根据在数据中发现的描述对象及其关系的信息。将数据对象分组,其目标是:组内对象之间是相似的不同组的对象是不同的换句话说,也就是组内相似性越大越好,组间的差别越大越好。聚类的种类划分聚类(partitional clustering):将数据对象集划分成不重叠的子集层次聚类(hierarchical clustering):嵌套的集簇,组合成一棵树互斥的(exclusive原创 2017-09-26 09:05:57 · 920 阅读 · 0 评论