【论文笔记】:《Lifelong Spectral Clustering》

清泉Kikyō

已于 2022-06-13 23:43:03 修改

阅读量498

点赞数 2

分类专栏：人工智能文章标签：论文笔记

于 2020-12-05 01:44:18 首次发布

本文链接：https://blog.csdn.net/qq_33810513/article/details/110676203

版权

6 篇文章 0 订阅

订阅专栏

题目：Lifelong Spectral Clustering ，终身谱聚类

论文链接：https://arxiv.org/abs/1911.11908v1

本论文基于两篇论文，对谱聚类的目标函数拆分成矩阵相乘相加的形式，然后这些矩阵分为3类，第一类是任务样本直接相关的矩阵，第二类是多个任务共享的矩阵，第三个是其他。这篇论文中的第二类矩阵有两个，灵感来自两篇论文。

终身学习体现在，多个任务共享的矩阵要保存下来，每一个新的任务加入时，可以加快聚类速度，然后更新共享的矩阵；多个任务的整体目标函数为多个任务目标函数的平均值，一个任务的目标函数为F的话，多个就为 $\frac{1}{m}\sum F$ 。

刚开始被“拉普拉斯矩阵”吓到了，看上去很高级的样子，其实计算方式很简单。只推荐两个博客：

我个人对这两篇博客的笔记在：github链接的“谱聚类”部分

在本文中，旨在探讨终身机器学习框架中的谱聚类问题，即终身谱聚类（ $L^2SC$ ，Lifelong Spectral Clustering）。它的目标是通过有选择地从知识库中转移以前积累的经验，为新的谱聚类任务有效地学习一个模型。

具体来说， $L^2SC$ 的知识库包含两个组件：1）正交基础库：在每对任务中的集群中捕获潜在的聚类中心； 2）特征嵌入库：嵌入在多个相关任务之间共享的特征流形信息。

随着新的谱聚类任务的到来， $L^2SC$ 首先从基础库和特征库两者中转移知识以获得编码矩阵，然后随着时间的推移重新定义库的基础，以最大程度地提高所有聚类任务的性能。同时，推导了通用的更新公式来交替更新基础库和特征库。

公式（1）：L是拉普拉斯矩阵（度矩阵-权重矩阵），D是用来归一化的，得到 $W_N^t$
公式（2）： $K^t$ 是 $W^t$ 没有N的约束的公式，就是标准化后的拉普拉斯矩阵， $F^t$ 是 $K^t$ 的特征分解后的最优聚类分配矩阵（其实还是用来给后续K-means之类的分类用）
公式（3）： $F^t=E^tB$ （论文引用中的公式），代入公式2，求平均 $\frac{1}{m}\sum 目标函数$ ，得到公式3
公式（4）：引用了新的论文公式，得到图联合聚类的目标函数。公式（3）没有考虑多任务间的公共特征嵌入转移，这个公式考虑了，这个是基于图的联合聚类（co-clustering）来控制和实现任务间知识转移（又是一个求平均（ $\frac{1}{m}\sum 目标函数$ ））。L是group联合约束下的特征嵌入库（跟拉普拉斯矩阵一个符号，但不是同一个）
公式（5）： $\widehat{X}=D_1XD_2$ ,，解释公式（4）一个变量的
公式（6）：公式（3）和（4）得到公式（6）（公式3和4的 $E^tB$ 是相同的），公式里的变量为 $E^t,B,L$ ,由任务样本直接决定的是 $\widehat{X},K^t$ ， $K^t$ 根据公式（2）可知是当前样本矩阵 $X$ 的标准化后的拉普拉斯矩阵。多个任务间通过共享 $B$ 和 $L$ 实现常识共享。

第m个任务下：

算法模型的主体部分就是L，B， $E^m$ ， $\Theta$ 四个值的更新，每个任务到来执行一次迭代，迭代到收敛为止。

by Sneexy

关注

专栏目录