读《用于图学习的主干图核方法》

本文探讨了图核函数在处理结构化数据如图时的作用,回顾了从1999年至今的图核方法发展,包括卷积核、随机游走核、最短路径核等。文章提出了主干图的概念,用于定义图中重要子结构,并介绍了如何通过递归构造n阶主干图。此外,还提出了一种基于主干图的核函数和自适应离散粒子群聚类方法。实验部分展示了在Mutagenesis、PTC和HIA数据集上的应用。
摘要由CSDN通过智能技术生成

摘要

定义图中重要程度较高的子结构为主干图,降低学习规模

0.前言

核方法通过将数据映射到高维特征空间,然后在新的特征空间中分析和处理数据。
由于该方法只需要构建一个核函数来度量样本之间的相似度,与其数据的表现形式
并无联系,并且它能够很好地保证其泛化性能,因此,它能够有效地对图这样的结构化数据进行机器学习。

1.研究背景

1.1 图核函数

基于路径相关的图核方法

1999 年,David Haussler[6]提出卷积核
2003 年,Gertner,Flach,Wrobel[3]等人提出计算同构是NP难问题,并提出随机游走核求近似解
2005 年,Frhlich. H[7]等人提出了最佳完美匹配核函数
Karsten M.Borgwardt、Hans-Peter Kriegel[8]提出了另外一种基于弗洛伊德算法的最短路径核函数
2006 年,S. V. N.Vishwanathan[4]等人在随机路径核函数的基础上提出了一种快速的随机路径图核函数

加权分解核[9]
基于子树的图核方法[10]

——————
2010 年,Adam Wo zˊnica、Alexandros Kalousis[11]等人提出了一种自适应的图核函数,并给出标准图核的条件

  • 可计算图之间相似性
  • 多项式时间复杂度
  • 核矩阵半正定
  • 可应用于多种图结构上

1.2 核矩阵学习

  1. 构造核函数
  2. 学习核相似矩阵

2 方法

2.1定义

标签图

对节点和边分别注标签

主干图

度足够大的节点叫主干顶点,主干顶点组成主干图

n阶主干图

通过无向图递归构造
在这里插入图片描述
同时记录subG为主干图对应的子图

2.2 主干图核

2.2.1

在这里插入图片描述在这里插入图片描述

前半定义主干图相似性,后半定义对应子图相似性

2.2.2 复杂度和半正定分析

通过DPS生成随机路径,构造[4]的随机路径核K(),可知复杂度为o(n3)

半正定也已有[4]证明

2.3 自适应离散粒子群

聚类
在这里插入图片描述

3.实验

3.1 数据集

Mutagenesis 是诱变分子数据集
PTC 是致癌分子数据集
HIA 是人体小肠吸收分子数据集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值