网络定义
网络是描述交互实体的复杂系统的通用语言
Network are a general language for describing complex systems of interacting entities.
网络的分类
自然网络
- 由70+亿人组成的社会
- 由电子设备组成的通信系统
- 基因/蛋白质调节生命的相互作用
- 脑中的思绪背后所隐藏的亿万级神经元联系
信息网络
- 信息/知识被组织和链接
- 场景图:一个场景中的对象如何联系
- 相似网络:获取连接相似点的数据
有时区分是模糊的
网络的例子
主要问题
- 这些系统是如何组织的?
- 设计原则是什么?
许多系统背后都有错综复杂的接线图,网络,定义了组建之间的相互作用。
如果我们不明白系统背后的网络,将不能有效的对其建模和预测。
很多数据类型都是图:
我们如何利用关系结构进行更好预测?
复杂域(知识,文本,图像等)具有丰富的关系结构,可以将其表示为关系图。
通过显示建模关系,我们可以得到更好的性能表现。
为什么要研究网络?作用?
- 描述复杂数据的通用语言,来自科学、自然、技术的网络相似程度比人们意识到的更多。
- 领域间共享 计算机科学,社会科学,物理,经济,统计,生物学等不同领域的东西可以被表示为网络。意味着可以设计算法交叉来自不同领域的不同网络。
- 可用数据和计算挑战 网络/移动互联网,生物,医疗和药理。
- 影响 社交网络,药物设计,AI推论
分析网络的途径
- 节点分类,预测给定节点的类型/颜色
- 连接预测,预测两个节点是否连接
- 群体检测,识别节点的密集连接簇
- 网络相似性,测量两个网络/节点相似性
网络的应用
- facebook social graph中的人际圈子,分析他们为什么存在。
- 不同知识融合的网络,研究之间的联系
- pinterest的内容推荐
- 推特上的极化效应
- 分析文章是否为恶作剧。(真实的文章相比恶作剧的文章具有更连贯性)
- 级联效应: 由于其他用户的邀请,有60-90%的LinkedIn用户进行了注册。
- 多种药一起吃的副作用预测 (70-79岁中46%的人同时吃5种以上的药)
课程大纲
- 介绍图结构
- 网络测量和随机图模型
- motif 和 graphlets
- 网络结构角色
- 谱归并
- 信息传递和节点分类
- 节点表示学习
- 图神经网络
- 图的深度生成模型
- 关系分析:pagerank和simrank
- 网络影响和级联行为
- 网络影响最大化
- 网络爆发检测
- 网络健壮性和优先连接
- 知识图谱和元路径
- 网络建设、推理和反卷积
网络结构
网络是对象的集合,其中一些对象对通过链接连接
网络元素:
对象Objects:节点nodes,顶点vertices
N
N
N
链接Interactions:链接links,边edges
E
E
E
系统System:网络network,图graph
G
(
N
,
E
)
G(N,E)
G(N,E)
网络和图的区别:
网络通常表示真实系统,如互联网,人际网,代谢网络,常用网络,节点和链接来描述。
图是对网络的数学表示,如互联网图,社交图,知识图谱等,常用图,顶点,边来描述。
虽然在尽力区分两者,但是在大多数情况下,这图和网络是都使用的。解决不同问题的时候,选择最适合的、正确的网络表示。
网络定义
- 有向&无向
-
节点度数 Node Degress
-
完全图 Complete Graph
一个带有 N N N个节点的无向图的边的最大数量是
E m a x = ( N 2 ) = N ( N − 1 ) 2 E_{max} = \bigl( \begin{matrix}N \\2\end{matrix}\bigl) = \frac{N(N-1)}{2} Emax=(N2)=2N(N−1)
一个边的数量 E E E等于$E_{max} 的 无 向 图 被 称 为 ∗ ∗ 完 全 图 ∗ ∗ , 他 的 平 均 度 为 的无向图被称为**完全图**,他的平均度为 的无向图被称为∗∗完全图∗∗,他的平均度为N-1$ -
二分图 Bipartite Graph
二分图是一种节点可以被划分为没有交集的两个集合 U U U和 V V V 且任一链接都是连接 U U U中的一个节点和 V V V中的一个节点,这意味着 U U U和 V V V是独立的集合。
例子:
作者-论文(作者的论文)
演员-电影(演员参与电影)
用户-电影(观众给电影评估)
配方-原料(配方包含原料)
“折叠的”网络 “Foled” Network:
作者合作网络
电影共同评价网络
在Projection U中,节点6和7连接是因为在U-V图中,6和7都链接在了节点D上。Projection D同理。
图的表示
邻接矩阵
度的计算
- 无向图
无向图来说,一个节点的度 = 横向/纵向上非0元素的个数 - 有向图
对于有向图来说,出度为横向上非零元素的个数,入度为纵向非零元素的个数
边集合
邻接表
- 当网络规模大或者稀疏的时候,邻接表更易工作。
- 允许快速检索给定节点的所有邻居。
图的性质
- 大多数现实的网络是稀疏的。(即使显示中的网络很大,平均度数都是比较小的)
边的属性可选项
- 权重,如沟通频率
- 排序,如最好的和次好的朋友
- 类型,如朋友,有关系,合作
- 标记, 如朋友与陌生,信任与不信任
- 基于网络其他信息的结构的属性,如共同朋友的数量
图的更多类型:
-边上带权重的和不带权重的
-节点上有回边的和节点间有多边的
无向图的连接性
- 连通图 Connected Graph:任意两个顶点都有一个路径相连
一个非联通图是由于两个或者多个连通部分组成
桥边 Bridge edge:如果我们去除这条边,连通图将变成非连通。
接合节点 Atriculation node: 如果我们去除这个点,连通图将变成非连通。
例子:
- 强连通与弱连通
强连通有向图 Strongly connected directed graph:有向图中有一条路径连通两点,反向也是连通的。如存在A-B的路径,就会存在B-A的路径。
弱连通有向图 Weakly connected directed graph:有向图在不考虑方向的情况下是连通图
强连通组成 Strongly connected components (SCCs)
阅读材料
- P. Erdos, A. Renyi. On Random Graphs I. Publ. Math. Debrecen,1959.
- P. Erdos, A. Renyi. On the evolution of random graphs. Magyar Tud. Akad. Mat. Kutato Int. Koezl., 1960.
- B. Bollobas. Random Graphs. Cambridge University Press.
- M.E.J. Newman, S. H. Strogatz and D.J. Watts. Random graphs with arbitrary degree distributions and their applications. Phys. Rev. E 64, 026118, 2001.
- R. Milo, N. Kashtan, S. Itzkovitz, M.E.J. Newman, U. Alon. On the uniform generation of random graphs with prescribed degree sequences. Arxiv,2004.
- D. Ellis. The expansion of random regular graphs. Lecture notes from Algebraic methods in combinatorics, Cambridge University,2011.
- S. Arora, S. Rao and U. Vazirani. Expander Flows, Geometric Embeddings and Graph Partitioning. In proc. STOC '04, 2004.