Chapter 1 Introduction
第一章主要是一些介绍性的内容。
图是在描述复杂系统时一种常见的数据结构,通常一张图由节点的集合和节点之间的关系(边)组成。例如,在用图表示社交网络时,我们可以用节点表示个体,用边表示不同个体间的朋友关系(如下图所示);在生物领域我们可以用节点表示蛋白质,用边表示蛋白质间的各种生物关系。
图结构的优势在于它能比较好的表示节点间的关系,同时具有较强的通用性和一般性,同一张图可能既能表示社交网络,又能表示药物和蛋白质间的关系、分子内部的不同原子间的相互作用。
本书的重点是,如何利用机器学习算法挖掘大规模图数据中的有用信息。
1.1 What is a Graph
本节主要给出一些基本定义和图的类型。
首先,将图表示为 G = ( V , E ) G=(\mathcal{V,E}) G=(V,E), V \mathcal{V} V代表节点集合, E \mathcal{E} E代表边的集合,将节点u和v之间的边记为 ( u , v ) ∈ E (u,v)\in \mathcal{E} (u,v)∈E。最简单的情况是两个节点之间只有一条边、没有自环、边是无向的。
表示一张图可以使用邻接矩阵 A ∈ R ∣ V ∣ × ∣ V ∣ A\in \mathbb{R}^{|\mathcal{V}|\times|\mathcal{V}|} A∈R∣V∣×∣V∣,当 ( u , v ) ∈ E (u,v)\in \mathcal{E} (u,v)∈E时有