【论文精读】A Support Vector Clustering Method

A Support Vector Clustering Method

原文地址:A Support Vector Clustering Method

本文介绍了一种支持向量聚类的方法。

Abstract

本文展示了使用支持向量进行数据聚类的方法,使用核技巧将数据从低维映射到高维,在高维空间中,边界是超球面,低维中边界显示为不规则的几何形状。

Describing Cluster Boundaries with Support Vectors

SVM for Clustering这篇博文的原理类似,通过拉格朗日法找到高维映射空间中能够包含所有样本点的半径最小的超球面。然后通过对偶,求解关于拉格朗日系数的最大值,引入高斯核和松弛变量,来解决欠拟合和过拟合的问题。

The Clustering Algorithm

再多类别聚类中,首先确定类别的个数,然后选择合适的点作为各类别的球心,通过求算各个样本点距离个球心的距离,选择最近的那个球心所对应的类别作为此样本点的类别(这里有点类似于K-means中归类的方法),每次有新的样本被分类,便可以根据算法重新计算分类的边界。最终每个类别的边界由 q q C两个参数决定。 q q 值越大对数据拟合程度越好,但容易出现过拟合;C越小边界越平滑,当满足 C<1 C < 1 时,可以出现离群点。

下图为SVC与K-means聚类效果比较:

SVC

K-means

但文中并未介绍overlapping的处理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值