这篇文章里只介绍CO-CLUSTERING BASED MULTI-TASK MULTI-VIEW CLUSTERING FRAMEWORK部分的内容
Multi-Task Multi-View Clustering是综合了Multi-Task和Multi-View两种方法来实现多任务学习,通过一个Common View筛选出样本的公共特征,利用公共特征来开展整个学习的过程,就我看来,文章里并没有提供Common View的计算方法,需要样本自己提供。
Common View的概念如上图;
CO-CLUSTERING BASED MULTI-TASK MULTI-VIEW CLUSTERING FRAMEWORK部分有以下几个部分。
1.Within-View-Task Clustering
2.Multi-View Relationship Learning
3.Multi-Task Relationship Learning
其中1是遍历每一个任务的每一个视角完成聚类,2的作用是使同一个任务下两两视角的差异之和最小,如何实现我将在后面提到。3是找出在同一个视角下相关任务的shared subspace。关于这个shared subspace,我的理解是公共样本矩阵和公共特征矩阵。
接下来是算法的详细设计和构思
1.Within-View-Task Clustering
这个的证明是利用矩阵的迹的一些性质和*U=I,
*M=I(MT是M的转置)以及D1,D2均为常量完成的,只需要将矩阵展开相乘再变化一下就可以由(2)——>(3),有时间我把证明过程贴上。
1的主要目的是学习出合适的U、M,使(3)得以成立。
矩阵转置的迹和原矩阵的迹相等这个就不用我说了吧。还有D1,D2是对角矩阵。
2.Multi-View Relationship Learning
这个的证明过程和上面的类似,都是利用tr()的性质变换矩阵,消去常量推导的·。他的目的是在一的基础上加入多视角方面的考虑,选择综合二者的优化后的 ,
。
证明:
3.Multi-Task Relationship Learning
这一个利用的原理应该是SVD,通过common view v筛选X里的共享的那些特征(feature),然后利用SVD分解求出最优的共享特征的特征向量矩阵,还有就是和1,2一起的
。
顺便说一下,
U:the composed of the first c eigenvectors of features.U(d是特征数量,c是要聚类的样本数量)
M:the composed of the first c eigenvectors of samples.U(n是样本数量,c是要聚类的样本数量)
二者分别是由X 计算出来的,
代表在task t&view v下U的子集。
4.The Overall Objective Function
从这里我们可以看出来,CO-CLUSTERING BASED MULTI-TASK MULTI-VIEW CLUSTERING FRAMEWORK是基于1的基础上纳入2,3中的multi-view的影响和multi-task的影响,得到需要的,在它的基础上进行k-means算法,得到结果。
计算优化:
优化1
其中,Definition1是找一个与目标矩阵最近似乎的矩阵X,满足=I (X不是方阵,所以不是正交矩阵,但有类似的意思,我也解释不清,希望大佬赐教)。Definition·2是把St(n,p)的东西变成函数
(X)。Proposition1给我们解释
(X)的计算方法。其余的就不多说了,(10)是梯度法学习参数+
(X)。顺带一提,这个方法的设计是利用参数之间的相互关系迭代优化设计的。给前一代的
,计算
。
优化2
和优化1差不多。给,算
(common view v下的特征矩阵)。
优化3
这个东西要分情况讨论,当中的view v是common view 并且task t属于v下的公共任务集时,
需对整个目标式进行求解,因为我们目标函数的三个部分函数都有它的存在,见(14)。求解方法同优化1,优化2。反之,当view v不是common view 或者view v是common view ,但task t不属于v下的公共任务集时,Multi-Task Relationship Learning这一过程的条件它不满足,只计算前两部分。见(16)。
Summary
第一次写博客,做的不好的地方还有很多,如果有什么问题,请联系我,我会尽力解决。
以上。