多视角聚类(一)Multi-view clustering on data with partial instances and clusters

该文提出了一种新的多视角聚类算法(MVPIC),旨在解决实例在某些视角缺失及聚类在某些视角不完整的情况。通过非负矩阵分解(NMF)和指示矩阵,MVPIC算法能够在不完整数据中进行有效的聚类。文章介绍了在实例缺失和聚类不完整两种情况下的目标函数,并展示了如何通过优化这些目标函数来减少不同视角间同一目标的差异。尽管算法思路简洁,但对数据残缺的处理仍有待改进。
摘要由CSDN通过智能技术生成

多视角聚类(一)Multi-view clustering on data with partial instances and clusters

 

Linlin Zong ∗, Xianchao Zhang, Xinyue Liu, Hong Yu Key Laboratory for Ubiquitous Network and Service Software of Liaoning Province, Dalian School of Software, Dalian University of Technology, Dalian, 116620, China

一.文章所主要解决问题

在以往的多视角聚类算法中,一般有如下两个假设:(1)所有实例在所有视角中都出现且它们以同样的方式被索引;(2)所有聚类在所有视角都存在且都是相同实例的子集。

但本文结合真实情景,主要解决两种情况:(1)某些实例可能在某个视角是缺失的;(2)某些聚类在某个视角可能是缺失的。

二.主要思想

1.The MVPIC algorithm

首先在单视角中采用NMF(非负矩阵分解)算法。

U.,k是U的第K列向量,Vj,.是V的第j行向量。每个数据向量xj通过U列的线性组合(被V加权),因此U的每列可以看作是基础向量。如果r代表聚类个数,V的每行便可以看作是实例的指示矩阵。Vj,.的第k个元素便是第j个实例属于第K个聚类的置信度。相当于V的每一行是一个实例,每一列就是一个聚类,第i行第j个元素便是第i个实例在第j个聚类中的置信度。

在第v个视角中,NMF想要最小化的目标函数是:

其中\hat{V}^{}v是近似指标矩阵,它的第j行表示在第v个视角的第j个实例;\hat{U}^{}v是基矩阵,它的第i列表示第v个视角的第i个聚类的基向量。

2.下面先讨论某些实例在某个视角缺失而聚类在每个视角都是完整的情况:

有目标xi,如果x_{}j^{}v是它在第v个视角的代表,那么x_{}j^{}v就应该近似于V_{}i.^{}*(即_V{}*的i行)。

V_{}i.^{}*是未知的,但可以通过第i个实例在每个视角的近似指标矩阵聚合得到。引入一个v视角的权重参数\alpha _{}v\geq0。

,这样便可以得到V_{}i.^{}*。下面引入一个实例-视角指示矩阵C^{}v:

即只有当x_{}j^{}v是目标xi的代表时C才为1,否则便为0。这样若V视角下xj不存在,则C为0。即C来指示实例是否在v视角里。

所以总的目标函数是:

文中举例:

3.下面讨论实例和聚类都不完整的情况:

引入了一个W参数:

即用W来指示视角v里面是否还有这个聚类。

目标函数是:

这个式子和上面一样,是总的误差。

D表示的是某个目标集在v视角和h视角中都有,所有要使它们之间的差异尽可能小。结合(6),(7)两式就得到总的目标函数:

文中举例到:

如上图,第一聚类和第二聚类在第一视角中都存在,第三聚类和第一聚类在第二视角中都存在。所以第一视角中的目标1和成比例,第二视角的目标1和成比例,通过优化来减小不同视角相同目标之间的差异,我们想使趋近于0.

4.优化

用的就是更新一个数,固定其他数。

三.结语

这篇文章思路还是比较简单,主要亮点就是用类似于分派函数的指示矩阵来判定。如用实例-视角指示矩阵来判定实例是否在视角中,用聚类-视角指示矩阵来判定聚类是否存在视角中,符合真实世界中某些实例或聚类在某个视角可能不存在的情况。

但个人感觉关于数据的残缺其实还是没有做出一个好的补充或解决方案。

 

 

 

 

 

 

 

 

 

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值