读《Halting in Random Walk Kernels》

摘要

halting(停顿?):为保证收敛,比k长的路径会被降权,这就导致相似度完全被长为1的路径所掌控

1.引言

they are almost identical to a simple comparison of edges and vertices, which ignores any topological information in the graph
beyond single edges.

halting也可以解释为:那些路径被降权,相当于忽视了除一阶邻居之外的所有拓扑信息

本文的主要目的是解决halting是否以及何时出现在随机游走图核当中。

2.理论

2.1 随机游走核

定义图G三元素,点集V,边集E,以及映射 φ : V ∪ E → Σ,其中点和边标签的范围为 Σ
定义Gx表征相似的两个graphG和G’,
在这里插入图片描述
以及对应邻接矩阵Ax
从而得到k阶随机游走核在这里插入图片描述
可理解为,对k阶以内的所有邻接矩阵求加权和矩阵(有点像切比雪夫网络),再对该矩阵按节点求和
如果权重λ也是等比数列,那么可看做几何级数求极限得到
在这里插入图片描述
此时记(I-λAx)x=0齐次线性方程组,有λAxx=x,(λAx)lx=x
从而若(λAx)l收敛到0,该齐次线性方程组有零解,则系数矩阵I-λAx可逆
从而
在这里插入图片描述
由于上式左侧可收敛,则右侧矩阵幂级数也收敛,所以λAx的谱半径(即λAx的特征值绝对值中的最大值)应小于1,记其为μmax,则μmax<1/λ,从而λ<1/μmax
而考虑到度和特征值(谱半径)的联系***(?)***,可将上式的μmax替换为Gx的最大度

在归纳学习设置中,由于还不清楚将会碰上怎样一个先验目标图,所以对任意一对未知的图,应将λ设的足够小,满足λ<1/μmax。否则就得重新训练核了

2.2 halting

理论上讲几何随机游走核KGR是将所有步长考虑在内的,但其中步长为k的路径被λ^k加权,而λ < 1(因为要使等比级数收敛,公比应小于1),所以长路径的贡献被削弱

在这里插入图片描述
在这里插入图片描述
从而有
在这里插入图片描述

3.实验

常用的图分类数据集,有蛋白质、化合物:ENZYMES, NCI1,NCI109, MUTAG, and D&D

采用线性核(包括节点、边、标签、以及组合对应的),高斯RBF核(点-边标签的),随机游走核(几何随机游走核和k步随机游走核),Weisfeiler-Lehman子树核

4.结论

  1. 首先,如果在已知最大度数的图数据集上使用几何随机游走内核,则 λ 应该接近理论最大值。
  2. 其次,应该使用基于点和边标签直方图的简单基线核来凭经验检查随机游走核是否提供比这些基线更好的准确度结果。
  3. 第三,特别是在最大度数较高的数据集中,最好使用固定长度 k 随机游走核而不是几何随机游走核。

思考

主要是对图核有了基础的认识,知道有这么一种方法可以解决图结构数据相似性的问题。只是这种方法看起来很有数学完备性,也是图论的老理论了吧,应用到深度学习中还有市场吗

1,2,4,5。7.9,11,12.13.14.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值