每天更新图机器学习(内含大量图机器学习相关概念理解)基本概念(3)

前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,而图机器学习又是机器学习中当前最受欢迎的一个分支,目前已经广泛应用在社交分析、推荐系统以及生物新分子的研发等方面。相信大家在学习的过程当中会遇到各种各样的全新名词,但在网络上又很难以查询,出于这种考虑,本文主要将其中的一些名词给予解释,概念主要以图机器学习为主,也混杂着很多的机器学习和深度学习的知识。

目录

前言

一、如何利用特征工程进行图的节点级的异常检测?

二、异构图

三、基于元路径的随机漫步

四、图机器学习边缘级异常检测的方法

五、垮域快速图卷积FSGC(Cross-Domain Fast Graph Convolutions)

六、超级图


一、如何利用特征工程进行图的节点级的异常检测?

要进行图的节点级的异常检测,可以使用特征工程来提取有意义的特征,并使用这些特征来训练异常检测模型。以下是一些常用的特征工程方法:

1. 节点属性特征:节点的属性信息可以包括节点的文本描述、分类标签、数值属性等。可以将这些属性转化为特征向量,例如使用独热编码或者词袋模型来表示文本属性。

2. 邻居特征:节点的邻居节点的属性和关系可以提供有关节点的上下文信息。可以根据邻居节点的属性特征构建聚合特征,例如计算邻居节点的平均值、最大值、最小值等。

3. 图结构特征:图的结构信息可以反映节点之间的连接关系。可以计算节点的度、聚集系数、图中的路径长度等。还可以使用图嵌入算法(如DeepWalk、Node2Vec)来获取节点的向量表示。

4. 基于子图的特征:通过提取节点的一部分子图作为特征,可以捕获到局部的连接模式。子图可以使用固定大小的邻域或者基于节点距离的扩展子图。

5. 统计特征:根据节点的度分布、属性分布等统计信息来构建特征。例如,节点的度中心性、特征的均值、方差等。

在进行特征工程后,可以选择合适的异常检测算法来训练模型,例如基于统计的方法(如离群因子、箱线图、Z-Score等)、机器学习方法(如支持向量机、随机森林、深度学习网络)或者图神经网络方法(如图自编码器、图卷积网络)。

需要注意的是,特征工程的选择和设计应该根据具体的问题和数据进行调整,以促进异常检测模型的性能和效果。

例如:假设我们正在分析社交媒体平台上的用户行为,并希望检测异常行为,比如恶意发布内容或异常活动。在这个例子中,我们可以将用户的属性特征包括年龄、性别、注册时间等。邻居节点特征可以是该用户的关注者和被关注者的属性,比如他们的活跃度或关注的话题。图结构特征可以是用户之间的社交网络关系,例如用户之间的关注关系和互动频率。基于子图的特征可以是用户在某个时间段内产生的活动子图,例如他们发布的内容和其他用户对内容的喜欢、评论和分享。统计特征可以是用户活动的频率、持续时间的均值和方差,或者是某个时间段内用户发布内容的话题分布。利用这些特征工程后的特征,我们可以采用各种异常检测方法来检测恶意用户或异常活动,以保护社交媒体平台的安全性和用户体验。

二、异构图

异构图是指图中节点具有多样性的图结构,即图中包含不同类型的节点和边。这些不同类型的节点和边可以代表不同的实体和关系,例如用户、商品、用户与商品之间的交互行为等。异构图广泛应用于许多领域,如推荐系统、社交网络分析、知识图谱等。

在异构图中,特征工程可以针对不同类型的节点进行,考虑其具体的属性和关系特征。例如,在一个电商推荐系统中,我们可以将用户节点的属性特征包括用户的购买历史、个人信息等;商品节点的属性特征可以包括商品的类别、销售量等;而用户和商品之间的交互行为可以表示为边的属性特征,如购买行为的时间、评分等。此外,还可以考虑节点的邻居节点特征和边的上下文特征等。

在进行异常检测时,我们可以利用这些特征,结合适用的异常检测算法来识别具有异常行为的节点或边。例如,可以使用图自编码器或图卷积网络等方法对异构图进行建模,并通过重构误差或节点嵌入表示来衡量节点或边的异常程度。同时,还可以使用统计方法如离群因子等来计算节点或边的异常程度。

总之,异构图的特征工程和异常检测需要充分考虑节点类型、节点属性、边属性和图结构特征等,以获取更加准确的异常检测结果。

三、基于元路径的随机漫步

基于元路径的随机漫步(Metapath-based Random Walk)是一种用于异构图中节点序列生成的方法。异构图中含有不同类型的节点和边,而元路径即节点类型间的连接顺序,例如"用户-商品-用户"或"作者-论文-作者"等。元路径表示了节点之间的特定类型关系,可以用于描述节点序列的语义和结构。

基于元路径的随机漫步的思想是,通过按照元路径的顺序在异构图中进行随机游走,从而生成一系列节点序列。在每一步,随机漫步会根据当前所在节点的类型和可选的下一个节点类型,通过分别选择相应的邻居节点进行移动。移动的方式可以是随机选择、按照一定概率选择或使用其他策略来确定。

基于元路径的随机漫步方法可以用于很多任务,例如异构图的节点分类、推荐系统、路径查询和图嵌入等。通过生成包含丰富语义和结构信息的节点序列,可以更好地捕捉异构图中节点之间的关系,提供更准确和有效的数据表示。

总结起来,基于元路径的随机漫步是一种通过按照元路径的顺序在异构图中进行随机游走生成节点序列的方法,可以用于多种任务中,能够提供更丰富的节点语义和结构信息。

四、图机器学习边缘级异常检测的方法

图机器学习中的边缘级异常检测是指在图结构数据中,对于边(即连接两个节点的关系)进行异常检测的任务。边的异常指的是与其他边相比具有不寻常特征或表现的边。

为了进行边缘级异常检测,可以借助图机器学习中的算法和技术。以下是一些常用的方法:

1. 基于图结构的特征工程:可以从边的结构和属性中构建特征。例如,可以计算边的度、共享节点的数量、连边的属性相似度等,并利用这些特征进行异常检测。

2. 异常度量:使用图中节点的度量指标,例如度中心性、接近度中心性、介数中心性等,结合其他边的特征来计算边的异常分数。较高的异常分数表明边更有可能是异常边。

3. 图神经网络(GNN):GNN是一种强大的图机器学习方法,能够学习节点和边的表示。通过在图上进行迭代消息传递和节点/边更新,GNN可以捕捉节点和边之间的复杂关系。可以将GNN应用于边缘级异常检测任务中,学习边的表示,并使用学到的表示进行异常分数的计算。

4. 集成学习方法:可以结合多个异常检测模型的结果,例如基于图结构特征的模型、基于异常度量的模型和GNN模型,通过投票或平均的方式来得到最终的边异常分数。

边缘级异常检测在许多应用中都具有重要的意义,例如社交网络中检测恶意关系、物流网络中检测异常运输路径等。通过应用图机器学习的方法,可以有效地识别和定位异常边,为数据分析和决策提供有价值的信息。

五、垮域快速图卷积FSGC(Cross-Domain Fast Graph Convolutions)

垮域快速图卷积(Cross-Domain Fast Graph Convolutions,FSGC)是一种用于处理异构图数据的图神经网络方法。它通过在异构图中进行快速图卷积操作,提取节点的特征表示。

FSGC的主要思想是将异构图中的节点分为不同的域,并在域之间建立连接。每个域可以代表不同类型的节点,例如用户、物品或关系。FSGC通过考虑不同域之间的关联关系,利用跨域的信息来更新节点的特征表示。

具体来说,FSGC使用了两个关键的技术:域连接和快速图卷积。域连接通过在不同域之间添加虚拟的边来建立连接,将不同类型的节点连接起来。这样可以传递跨域的信息,并在不同域之间实现特征共享和融合。快速图卷积是一种用于异构图的图卷积操作,它可以有效地更新节点的特征表示。

通过结合域连接和快速图卷积,FSGC能够在异构图上进行节点分类、链接预测等任务。它具有较高的效率和性能,可以处理大规模的异构图数据。

垮域FSGC是一种处理异构图数据的图神经网络方法,它能够利用异构图中不同类型节点之间的关联关系,并通过快速图卷积操作进行特征更新。该方法在推荐系统、社交网络分析等领域具有广泛的应用潜力。

六、超级图

超级图是一种特殊类型的图,它是由多个普通图组成的。在超级图中,每个普通图被称为一个子图,而超级图由子图之间的边连接起来。

超级图常用于多视图数据融合、多模态数据分析和多层次关系建模等任务。它能够有效地表示和分析复杂的关系模式和结构。

与普通图不同,超级图的节点可以是子图,而不仅仅是单个元素。这允许超级图在更高的层次上建模,并捕捉到子图之间的结构和关联。超级图还具有更丰富的表示能力,能够描述更复杂的关系和语义。

在超级图中,边可以跨越子图,形成子图之间的连接。这样的连接可以传递信息和影响,使得超级图在信息融合和传递方面更为强大。

超级图的应用非常广泛。例如,在计算机视觉中,超级图可以用于多视图图像识别和多模态数据的特征融合。在社交网络分析中,超级图可以用于多网络的连接和关系分析。在生物信息学中,超级图可以用于多维度基因组数据的整合和分析。

总之,超级图是由多个子图组成的复杂图结构,具有更高的表达能力和更复杂的关系建模能力。它在多视图数据融合和分析任务中具有广泛的应用。

总结

这里对文章进行总结:本文主要是作者在阅读《A Survey of Imbalanced Learning on Graphs: Problems, Techniques, and Future Directions》这篇综述的时候查阅总结的知识概念和方法,有关于机器学习尤其是图机器学习的相关解释,这篇综述主要是聚焦了图机器学习中的不平衡类问题的研究,希望能帮助到同样在看这篇综述的朋友们更好的理解这篇综述。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值