图机器学习 - cs224w Lecture 1 & 2 - 图的性质及随机图

最新推荐文章于 2022-03-28 09:54:20 发布

WineChocolate

最新推荐文章于 2022-03-28 09:54:20 发布

阅读量1.1k

点赞数 2

分类专栏：机器学习图机器学习学习笔记文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/New2World/article/details/105277863

版权

文章目录

最近在看 Stanford 的 Machine Learning with Graphs。然后在网上找相关的笔记或者其他人的理解，发现大部分内容是照搬并翻译 slides，没有一些个人的理解，而且很多地方只有前几个 lecture。所以打算自己整理一个系列的笔记供以后反复温习，也欢迎大家指正，共同学习。

Lecture 1: Introduction

Jure 提出了两个概念 Network 和 Graph，这两者的界限很模糊，但大致上我们可以将 Network 视为现实中的图，而 Graph 是一种更数学的描述方式。在很多复杂的系统之下都有错综复杂的关系网，比如食物链、化学物质的相互反应等。
课程标题很明确的表示了这个学科研究的是图，那么怎么研究。主要通过4个方面：

node classification
link prediction
community detection
network similarity

每一个方面后面当然会涉及到，所以即使现在不知所云也请稍安勿躁。

之前学的关于图的知识都没有进行这样的划分，但 Jure 提到这里不同的术语之间有微妙的区别（虽然感觉不是那么重要）：

Objects	Interactions	System
nodes	links	network
vertices	edges	graph
$N$	$E$	$G (N, E)$

其他的关于图的基本知识不再赘述，不清楚的朋友可以先去温习一下图的基础部分。

对于无向图的连通性有个有趣的现象之前没有注意过：若按一定顺序排列节点用邻接矩阵表示图的话，非连通图是严格的对角分块矩阵。

Lecture 2: Properties and Random Graph

描述一个图的特征一般有这样几个：

degree distribution: $P (k)$
path length: $h$
clustering coefficient: $C$
connected components: $s$

Degree Distribution

简单来说就是度的直方图，归一化后就是： $P(k)=N_k / N$ 。 $N_k$ 是有 $k$ 个度的节点个数。

一般来说，图的度分布是倾斜的，因此在可视化的时候可以选择用对数坐标，即 $10^1, 10^2, 10^3 ...$

Path Length

一般意义上，路径长度指两个节点间的最短路径。而一个图中最长的最短路径定义为这个图的直径(diameter)。然而某些奇奇怪怪的图可能会有一条很长很长很长的路径，那么会导致直径很大。这样会对图的描述产生倾斜或者说是偏差，因此一般用平均路径长度来描述路径长度。

$\bar{h}=\frac1{2E_{max}}\sum_{i,j \neq i}h_{ij}$

$E_{max}$ 是最大可能的边数，即

最低0.47元/天解锁文章

WineChocolate

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
图机器学习 - cs224w Lecture 1 & 2 - 图的性质及随机图

文章目录Lecture 1: IntroductionLecture 2: Properties and Random GraphDegree DistributionPath LengthClustering CoefficientConnectivityErdos-Renyi Random Graph ModelSmall-World ModelKronecker Graph Model最近...
复制链接

扫一扫