点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
图是建模实体与实体之间关系的常用数据结构。近年来,图数据挖掘引起了学术界和工业界广泛的关注,如分类、聚类等等。然而图相似度学习这一任务却未得到充分的研究,如何计算一对图结构数据之间的相似度?由于图结构数据的复杂、多样性,使得图相似度学习算法的设计充满了挑战性与特殊性。为此,本文基于图神经网络、图池化算子以及子图匹配等模块,设计了一种超图匹配框架来高效的进行图相似度推理。具体来说,本文提出的H2MN框架从超图的角度出发,将每条超边作为一个子图来进行匹配,捕获到了图上丰富的子结构相似性。为了降低匹配的时间复杂度,本文还设计了基于超边的池化算子来将大的超图转化为较小的超图。通过在多个公开数据集包括生物以及社交网络等类型图数据上进行验证,本文提出的方法在图回归以及分类任务上均取得了最佳的效果。
AI TIME 特别邀请了新加坡国立大学博士后张震,给大家带来分享《基于神经网络的多粒度图表征学习》。
张震:
新加坡国立大学博士后,2021年毕业于浙江大学计算机科学与技术学院,博士期间主要研究方向为数据挖掘、图神经网络与推荐系统,目前已在KDD、WWW、IJCAI、TKDE等国际顶级会议和期刊中发表多篇论文。
01
研究背景与意义
传统图挖掘算法示例
(1) 如果节点0、3、6、8标签已知
(2) 如何预测剩余未知节点的标签
人工设计特征
(1) 统计每个节点的出入度信息
(2) 计算每个节点到其余节点的最短路径均值信息
(3) 统计每个节点的子图信息
缺点:需要相关领域知识人工设计特征、灵活度不高
如何同深度学习一样去自动的提取图数据上的特征呢?
给定图G =(V,E) 其中|V|,|E|代表图中节点和边的个数,A表示的是图中节点边信息 构建的邻接矩阵
图表征学习的目标是通过映射函数学习出节点的表征向量,它可以捕获到图中的结 构、节点的属性以及标签等信息
图表征学习任务的难易程度取决于其输入以及输出的设置
(1) 图数据类型纷繁复杂,如何捕获不同类型图数据中的关键信息进行表征学习?(可能存在同构图和异构图,静态图和时序图)
(2) 图挖掘任务错综复杂,如何针对相关任务设计不同的图表征学习模型?(不同的任务,需要我们去捕捉不同的语义信息;对于表征的好坏也有不同的标准)
为了解决上述挑战,本文主要对输入以及输出四种不同粒度的表征学习问题展开了研究
横轴:模型输出的节点表征
纵轴:模型输出的图数据类型
02
主要研究工作
属性图中节点级表征学习
属性图是一种节点富含属性信息的图结构,例如社交网络中往往包含用户的年龄、 性别等资料信息
节点的属性信息可以进一步反映出图中的潜在模式
给定图G =(V,E,X)其中|V|,|E|代表图中节点和边的个数
(1) A表示的是图中节点边信息构建的邻接矩阵,
(2) X表示的是图中节点的属性信息
捕获图的结构以及节点的属性相似性
现有研究工作
(1) 将属性信息构建成图中的节点来建模节点和属性信息的共现关系
(2) 通过属性信息计算出节点之间相似度来约束节点的表征
(3) 通过属性信息计算出节点之间相似度来约束节点的表征
我们提出了一种新颖的无监督节点表征学习框架ANRL
(1) 该框架充分利用了节点与其邻居节点信息的相关性和节点属性信息与其上下文信 息的相关性来学习节点的表征
(2) 在建模节点属性信息的时候将节点的结构信息融入进来;反之亦然,在建模节点 结构信息时也巧妙地将节点的属性信息融入了进来
(3) 设计了邻居增强型自编码器和属性感知的Skip-gram模块
(4) 在6个数据集上进行了链接预测和节点分类实验,验证了模型的有效性
主要由以前两个模块构成:
邻居增强型自编码器模块
(1) 使用简单的多层感知器来对节点的属性信息进行编码和解码
(2)优化的损失函数