![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图挖掘
文章平均质量分 83
qq_38420683
这个作者很懒,什么都没留下…
展开
-
【论文笔记】SC16 ScaleMine: Scalable Parallel Frequent Subgraph Mining in a Single Large Graph
论文地址codeoverview本文可以认为是GRAMI: Frequent Subgraph and Pattern Mining in a Single Large Graph的改进版本。原创 2021-10-15 16:43:33 · 363 阅读 · 0 评论 -
【论文笔记】-mlsys-IMPROVING THE ACCURACY, SCALABILITY, AND PERFORMANCE OF GRAPH NEURAL NETWORKS WITH ROC
论文地址作者主页key idea解决了两个问题图划分问题:利用在线学习解决内存管理问题:利用动态规划解决ROC是个分布式多GPU的大规模图的GNN快速训练和推断的框架,能够在多个计算节点上训练全图研究现状传统CNN中,数据集可能很大,但单个数据如单张图片大小却比较小。通过对样本集的划分可以实现并行,即划分后,单个样本依然在同一个GPU的内存中。但GNN的数据样本为图,尤其在大图情况下,很难将一张图全部放入内存中。对于GNN,必须将数据样本(图)进行划分,进行分布式的情况下进行处理。为原创 2020-09-07 08:59:25 · 667 阅读 · 0 评论 -
【论文笔记】ICDE21 - Fast Core-based Top- k Frequent Pattern Discovery in Knowledge Graphs
论文地址问题定义kCP(k-core pattern):对于给定的core pattern上进行频繁子图挖掘,获得基于该模式扩展出的topK的频繁子图。与传统的基于支持度域值的贫乏子图挖掘略有不同,这里需要的时支持度最大的k个模式。本文采用的支持度为MNI,下文中支持度默认是MNI。简要流程用min堆对topk的模式进行存储。每个新的模式只需要与堆顶元素(最小值)进行比较,大于堆顶的元素则可以进行pop 堆顶,插入新的模式。在计算支持度时,由于需要获得topk ,所以需要采用精确计算。对于新产原创 2021-09-10 20:56:36 · 273 阅读 · 0 评论 -
【论文笔记】PVLDB14 GRAMI: Frequent Subgraph and Pattern Mining in a Single Large Graph
增长存储 到 增长计算存储是模式对应的实例,扩展后的实例必来自这。对于不存在的点,无需考虑。包含不频繁的边的图一定不频繁。借助MNICSP代替子图同构计算 ,实验结果并不明显三种优化...原创 2021-08-07 20:32:27 · 1172 阅读 · 0 评论 -
【论文笔记】sigmod15-COMMIT A Scalable Approach to Mining Communication Motifs from Dynamic Networks
相关资源论文地址硕士毕业论文代码(仅有可执行文件)作者主页问题本文的问题是:动态时序图中挖掘motif,可以认为是在时序图中挖掘频繁子图。在有向、无标签、有重边、有时序的图中,挖掘频繁出现的模式。时序图对于节点的连通性,论文中仅提到存在一个序列,以及序列上的边满足时序关联,未强调序列是否为通路。在毕业论文中,则强调了是通路。文中其他时序图中的定义不在赘述。算法仅在两处用到时间信息,一是在判断时序连通性上,二是确定模式内部边排列的顺序。在一个模式中,时间的作用是给出各边的顺序。主要贡献原创 2021-06-17 19:22:18 · 165 阅读 · 0 评论 -
gSpan 详解
gSpan简介gSpan是一种频繁子图挖掘技术,是基于深度优先遍历的。这里的深度优先是指的在子图扩展时采用的策略。gSpan: Graph-Based Substructure Pattern MininggSpan算法可以分为两部分,第一部分相当于预处理,第二部分是进行递归挖掘。下图为论文中的算法流程。第一部分的预处理是指的第1到第5步,剩下的是第二部分。第一部分 预处理gspan输入的是一个图,图中的边和节点是有标签的。首先是对图进行剪枝(对应算法流程中的1-2)。对节点和边根据频率进行原创 2021-04-20 17:04:15 · 3044 阅读 · 0 评论