可调参的K-means算法

选自:《Unifying Dependent Clustering and Disparate Clustering for Non-homogeneous Data

传统的K-means的算法如下:

这个表示的是聚类的簇,i代表的的是不同的类,i'代表的是类外的点,i是类内的点。这个公式是代表的类内的点到类外的点的距离肯定小。

有公式可以看得出,整个公式是一个类似的阶跃函数,很明显这个不符合现实生活的,通常情况下,我们通过高斯核函数来优化聚类函数,使其更加平滑,符合我们的的精准度的要求,但是这是一个固定的不可调节的过程。因此,上面的文章中涉及了一种可调参数的聚类方法,具体如下:

Define:

这里的D代表的是类的中心到类外的最短距离,y则是代表待分类点到类外的距离与最大距离的乘机,所有的点均为矢量,我们的目标就是最小化所有的y,在这里引入了自动化里面常用的用于矢量优化的K-S函数,

最后得到我们的聚类函数:

这里面的P为人为设定参数,可以调节D为距离。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值