在NeurIPS2020的演讲中,Google Graph Mining团队的创始人Vahab Mirrokni全面地介绍了Graph Mining and Learning。本讲座涉及图是什么,图为什么重要以及图在大数据中的位置。然后,讲座深入探讨了构成“图挖掘学习”的核心工具,并列出几个规范的用例。它还涉及了如何在不同的分布式环境下结合算法、系统和机器学习以构建可扩展的基于图的学习系统。最后,讲述了Google图挖掘和学习项目的简要历史。
视频链接:https://youtu.be/U03uS3DKcRQ
应用案例
No.1
使用图神经网络建模COVID
Modeling COVID with Graph Neural Networks
Amol Kapoor
在本演讲中,Amol Kapoor讨论了在补充时空流动性信息的情况下,如何使用GNN来预测美国各县COVID病例数的变化。主要介绍了最新的论文:Examining COVID-19 Forecasting using Spatio-Temporal Graph Neural Networks。https://arxiv.org/abs/2007.03113
视频链接????: https://youtu.be/wgePxF9BNZwNo.2
使用图挖掘进行隐私保护
Using Graph Mining for Privacy
Alessandro Epasto
在本演讲中,Alessandro Epasto回顾了图挖掘在隐私保护方面的应用。首先,我们将看到基于图的聚类在联邦联合学习(FLOC)的Google隐私保护工作中的应用。其次,将讨论有关如何使用设备上的计算来确保基于图的应用程序的隐私的研究。主要介绍了最新的论文:On-Device Algorithms for Public-Private Data with Absolute Privacy 和Efficient Algorithms for Private-Public Graphs.
视频链接????:https://youtu.be/e3wG4Jq45XU
No.3
因果推论
Causal Inference
Jean Pouget-Abadie
在这篇简短的演讲中,我们将探讨如何将聚类用于运行更好的随机实验。随机实验使我们能够估计因果关系,但是当目标单元不是独立的时,这种估计会受到影响。聚类用于通过避免具有不同治疗分配的单元组之间的相互作用来减轻此问题。主要介绍了如下两篇论文:Variance Reduction in Bipartite Experiments through Correlation Clustering 和 Randomized Experimental Design via Geographic Clustering .
视频链接????:https://youtu.be/zGjaVEHjOPo
大规模图挖掘
No.1
Grale:学习图
Grale: Learning Graphs
Jonathan Halcrow
在本次演讲中,Jonathan Halcrow讨论了Grale图构建框架,这是一种高度可扩展的工具,用于从任意数据生成学习的相似度图。介绍了最新的论文:Grale:Grale: Designing Networks for Graph Learning。
视频链接????:https://youtu.be/l0j2oscDKRA
No.2
相似度排名
Similarity Ranking
Alessandro Epasto
在本次演讲中,Alessandro Epasto提出了以下问题:如何测量图中两个节点的相似性?相似性排名具有重要的应用,包括推荐系统,链接预测和异常检测。我们将以可伸缩算法为重点,回顾无监督图相似度排名中的标准技术。我们还将展示一些相似度排名的最新应用。本演讲包括以下论文:Ego-net Community Mining Applied to Friend Suggestion和Reduce and Aggregate: Similarity Rankings in Multi-Categorical Bipartite Graphs.
视频链接????:
https://youtu.be/30vevrzV-cMNo.3
大规模集群
Clustering at Scale
Vahab Mirrokni
在此演讲中,Vahab Mirrokni概述了大规模集群。讨论从层聚类开始,它提供了其他聚类算法的基础。然后,本主题讨论了可伸缩的分布式平衡分区算法,并着重介绍了平衡分区在可感知缓存的负载平衡中的应用,以节省32%的闪存带宽。最后,它讨论了分布式可组合核心集和草图绘制技术,以及它们如何应用于k-clustering和k-cover的分布式算法。
视频链接????:https://youtu.be/v41TPQOWlF4
No.4
社区检测
Community Detection
Jakub “Kuba” Łącki
在本次演讲中,JakubŁącki提出了可用于在社交网络中查找社区的图聚类技术。除了回顾一些众所周知的技术外,演讲还介绍了一种用于检测和评估社区的新方法。新方法展示了具有竞争力的经验性能和良好的理论特性。
视频链接????:https://youtu.be/XfVVpjKOqy4
No.5
标签传播
Label Propagation
Allan Heydon
在本次演讲中,Allan Heydon介绍了Google的一种通过标签传播进行大规模半监督学习的系统。该算法仅需要对输入数据实例的一小部分进行标记,并通过沿相似图的边缘迭代传播标签来工作。因为它是作为大规模并行计算实现的,所以它可以缩放为具有XT边,XXXB节点以及可能有数百万个不同标签的图形。由于数据模型的通用性,它可以应用于各种各样的问题,包括垃圾邮件/滥用检测,图像/视频标签,自然语言处理,嘈杂的标签清洗以及用于下游监督模型训练的标签扩充。可以在Google Research Blog上找到更多信息。本演示文稿涵盖了论文:Large Scale Distributed Semi-Supervised Learning Using Streaming Approximation.
视频链接????:https://youtu.be/A6dBO64zwq4
图神经网络
No.1
GNN和图嵌入
GNNs and Graph Embeddings
Bryan Perozzi
在本次演讲中,Bryan Perozzi概述了图嵌入和图卷积。演讲首先从图形嵌入开始,如何创建它们以及为什么有用。然后,话题转向谈论图卷积。它涵盖了如何在图卷积中使用图嵌入,以及为什么图卷积网络提供了在单个统一的深层ml框架中合并节点上下文的灵活而强大的方法。最后,本演讲以对图学习的一些挑战的简短讨论结束。本演讲涵盖以下论文:
DeepWalk: Online Learning of Social Representations (pdf);
Semi-Supervised Classification with Graph Convolutional Networks (arxiv);
Neural Message Passing for Quantum Chemistry (arxiv);
N-GCN: Multi-scale Graph Convolution for Semi-supervised Node Classification (arxiv);
and MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing (arxiv).
视频链接????:https://youtu.be/sgRY9-p7z20
No.2
PPRGo:大规模GNN
PPRGo: GNNs at Scale
Amol Kapoor
在此演讲中,Amol Kapoor讨论了大规模运行GNN所面临的一些挑战,并提出了一种称为PPRGo的解决方案。本演示文稿涵盖了最近的论文:Scaling Graph Neural Networks with Approximate PageRank (arxiv).
视频链接????:https://youtu.be/J0m4NnTnft8
No.3
去噪GNN
Debiasing GNNs
John Palowitch
在本次演讲中,John Palowitch讨论了一种训练时间投影,用于对从无监督算法中学习的图形表示进行反偏。本演讲涵盖了最近的论文:Debiasing Graph Embeddings via the Metadata-Orthogonal Training Unit (arxiv).
视频链接????:https://youtu.be/mO69x3jFilc
No.4
学习多个嵌入
Learning Multiple Embeddings
Alessandro Epasto
在本次演讲中,Alessandro Epasto介绍了在学习图嵌入方面的最新进展。我们将展示一种新颖的方法来学习每个节点的多个嵌入,使我们能够更好地理解图的社区结构,并在下游ML任务(例如链接预测)中获得改进的结果。我们的方法基于Persona Graph方法,Persona Graph方法是一种新颖的图形分析框架,通过使用自我网络分析来识别复杂网络中的群集。本演示文稿涵盖以下论文:Is a Single Embedding Enough? Learning Node Representations that Capture Multiple Social Contexts (arxiv) 和Ego-splitting Framework: from Non-Overlapping to Overlapping Clusters (pdf).
视频链接????:https://youtu.be/5ZRZYePjS0c
算法,系统和可伸缩性
No.1
TensorFlow中的图神经网络
Graph Neural Networks in TensorFlow
Martin Blais
在本次演讲中,Martin Blais讨论了在Google规模上训练图神经网络模型所需的基础架构。我们引入了即将开放的开源TensorFlow库(“ TF GNN”或“图形张量”)和一组相关工具,以同时作为TensorFlow张量准备,表示和流传输不规则图形状的数据并构建GNN模型在它的上面。我们还将讨论可伸缩性方法以及有关实现的详细信息。
视频链接????:https://youtu.be/MTSb0HWPh9M
No.2
分布式图算法
Distributed Graph Algorithms
Jakub “Kuba” Łącki
在本次演讲中,JakubŁącki描述了处理万亿边缘图的挑战和技术。演讲讨论了如何在理论计算模型中捕获运行分布式计算的实际方面,以及建模和算法改进如何带来更好的经验运行时间。本讲座涵盖了多篇研究论文的内容,包括:Connected Components at Scale via Local Contractions (arxiv), Massively Parallel Computation via Remote Memory Access (arxiv), and Parallel Graph Algorithms in Constant Adaptive Rounds: Theory meets Practice (arxiv).
视频链接????:https://youtu.be/robb1JVyk-o
No.3
多核并行图聚类
Multi-core Parallel Graph Clustering
Jakub “Kuba” Łącki
在本次演讲中,JakubŁącki提出了单机并行聚类算法,该算法可以在几分钟内对数十亿条边的图形进行聚类。
视频链接????:https://youtu.be/sPRhwT_FNoE
扫码加微信 / QQ讨论群,与志同道合的小伙伴们一起学习,共同进步!
图与推荐
扫码关注我们/设为星标
图神经网络/推荐算法/图表示学习
您的“点赞/在看/分享”是我们坚持的最大动力!
坚持不易,卖萌打滚求鼓励 (ฅ>ω<*ฅ)