图对比学习 GMI code study

最新推荐文章于 2023-12-18 10:41:08 发布

Complicated__76

最新推荐文章于 2023-12-18 10:41:08 发布

阅读量707

点赞数

分类专栏： GNN-SSL learning 文章标签：学习人工智能算法

本文链接：https://blog.csdn.net/qq_40926715/article/details/127345193

版权

GNN-SSL learning 专栏收录该内容

37 篇文章 11 订阅

订阅专栏

talk

将对近年来的SSL-GNN做出一个整体分析，基于作者的开源代码

1. GMI

GMI的损失不像DGI下降的那么快，结果也一般。同时缺点很明显：GPU增加，时间变慢，epoch增加，精度没增加，这里双重DGI损失，没有采用双判别器，采用负采样+soft_plus
在这里插入图片描述

1.1 Cora dataset

在这里插入图片描述

1.2 Citeseer

在这里插入图片描述

1.3 Pubmed — dim=512， GPU OOM

在这里插入图片描述

— dim =256，才可以运行，但gpu 需要 18G，很大了。重构邻接矩阵所导致的问题

在这里插入图片描述
训练时间很长，epoch还是很大，结果也不尽人意

这里我额外做了两个实验，分别对文章所提出的额外的两个损失进行了消融，
首先不考虑重构

GPU减小

其次，再次不考虑 h 和其邻居（本文最大创新），这样就变成了和DGI损失类似，GPU当256时候在11G之下，和DGI作者当时在paper中报导的类似。但是收敛特别慢，结果也很差。
在这里插入图片描述

突然发现原论文的 code 对于citeseer和pubmed要求是一层！！！修改后

Pubmed 的GPU -usage还是很大。那就看效果吧。。。
在这里插入图片描述
还是一样~，没有达到论文acc

Notes：

原论文里面声称自己 citeseer 和 pubmed 的维度都是 512，且作者只是在 reddit 和 ppi 时候采用了 graphsage进行采样。且 GPU 是Tesla P40— 24G。这篇方法无疑是有问题的，后续的很多文章都是在 computers等amazon的数据集上都是OOM，也有见过pubmed 报OOM。

在这里插入图片描述
自己方法本来就有问题，还要踩一脚DGI，况且DGI 只是改变encoder 并不是什么复杂的事，GMI根本无法扩展。像这么胆大的作者简直了，还有勇气开源，，lol，，，不知道是不是自己之前的code有什么tricks，但开源的确实有很大问题，貌似西交这个作者把这个扩展成了期刊。如果有人可以复现~ 还请告知，谢谢~

2. Only spotlights in code

代码大都是和DGI一样的，但是计算损失不一样，并且采用了负采样（实际上不是我开始想象的那样采用5个负样本，而是 5次 shuffle 进行平均，损失不是采用交叉熵，而是 DIM 的变分 sp_plus）~~

采样：实际上这个负采样就是 dgi里面的 shuffle if条件使得所有节点都必须改变位置

这里根据 sample_times 进行采样，代码里面和原文保持一致，采样5个负样本，不对，这里是通过随机randint 产生的samole_list是包含五组，通过下标（randnum）。每一组都是 2708个index。这里和dgi的方式本质是一致的，同时通过判断，确认打乱的数组节点下标一定和之前不一样。（比dgi通过 np.random.permutation 打乱后有可能当前节点index还是一样）
在这里插入图片描述
这里计算损失确实和原文一致，采用了JS散度计算，目标函数和DIM中的JS损失的一样

感兴趣的同学可以去看 DIM 的原文，很经典的互信息无监督 cv表征学习的文章，其中有太多散度等知识，之前看过，每次都是晕晕的 DIM 分析

在这里插入图片描述
代码中的这个 mi_loss_jsd 就是计算出 js的MI，由于要最大化因此目标函数 = -1* 论文中的11（MI），因此这里code是两项相加
这里负样本得分传进来是 5组两次 mean 求得最终损失
DIM 损失 JSD-MI 计算

输入是正样本对的得分 + 负样本对的得分 res_mi_pos+res_mi_neg 计算节点h和s res_local_pos+res_local_neg 计算节点h和原始x
在这里插入图片描述
判别器修改：
h_c h_pl 是正样本对 12708256 127081433. sc_1是正样本对得分这里从 h_pl（节点中）中通过下标选出一组负样本 h_mi 127081433, 再次计算负样本和正样本的得分。返回的 sc_1 正样本。 sc_2是一个包含5个得分的随机采样负样本和正样本的得分，相当于是把 dgi 的负样本得分计算了五次，这样肯定会增大时间
在这里插入图片描述