图机器学习笔记
图机器学习 cs224w
1.Introduction, structure of graphs
1.1 网络(自然图)与信息图
要想对复杂系统进行建模或者预测,必须先理解这些系统背后的网络模式
1.2 Why Networks?
-
网络是通过的语言来描述复杂数据
-
网络分析是一个非常好的跨学科领域
-
数据可用性,有大量的网络数据
-
影响巨大
1.3 分析网络的方式
- 预测一个结点的类型(Node classification)
- 预测是否应该连接两个节点 (Link prediction)
- 确定密集连接的节点集合,集群任务(Community detection)
- 测量/量化两个节点/网络的相似性(Network similarity)
1.4 应用
- Social Networks
- Infrastructure 基础设施
- Knowledge 对给定领域的知识进行编码;这些网络可以是高度异构的
- Link Prediction
- Online Media(识别聊天的网络结构;识别错误信息或虚假新闻;传播现象)
- Biomedicine 生物医学
1.5 一些知识点
-
异构图 异构图是一个与同构图相对应的新概念。
传统同构图(Homogeneous Graph)数据中只存在一种节点和边,因此在构建图神经网络时所有节点共享同样的模型参数并且拥有同样维度的特征空间。
而异构图(Heterogeneous Graph)中可以存在不只一种节点和边,因此允许不同类型的节点拥有不同维度的特征或属性。
链接:https://www.jianshu.com/p/d97afb87ef20
-
超图 https://blog.csdn.net/m0_37683327/article/details/91048782
-
实质上是基于所拥有的数据量利用先验知识来提高模型的效率
-
学习使用的库SNAP.py 或者 SNAP C++
-
Connected Components 连通分量
-
Graph diameter 图的直径,图论中,图的直径是指任意两个顶点间距离的最大值.(距离是两个点之间的所有路的长度的最小值)
1.6 Structures of graphs
1.6.1 Components of a Network
- Objects : nodes, vertices N
- Interactions: links, edges E
- System : network, graph G(N,E)
1.6.2 Networks or Graphs
-
Network 通常指现实的系统,如Web,社交网络
Language: Network, node, link
-
Graph 一种网络的数学表达 Web graph, social graph , knowledge graph
Language : Graph, vertex, edge
2.Properties of Networks and Random Graph models
https://blog.csdn.net/weixin_45443685/article/details/105540544
2.1 Key Network Properties
-
Degree distribution : P(k)
随机选择一个结点度数为k的概率;即P(k) = Nk / N
Nk为 度数为k的节点个数,N为所有结点个数
-
Path length: h 图中的最短路径长度
图中的距离
Diameter 图的直径:图中任意两个节点之间的最大距离
Average path length
-
Clustering coefficient : C 为无向图定义的;社交网络分析中的聚类系数
Average clustering coefficient
一个顶点,它有K个邻居顶点【邻居顶点概念见上边**“2 顶点相邻**“】,这k个邻居顶点之间实际存在的边的个数比上这k个邻居顶点最多可能存在的边的个数这个比值就是这个顶点的聚类系数。
-
Connected components: s
Size of the largest connected component
2.2 Simplest Model of Graphs
Erdis-Renyi Random Graphs
E-R随机图 网络的一些属性
2.3 The Small-World Model
建立在随机模型之上
尽管随机图具有 与真实网络相似的最短路径长度,但是随机图的聚类系数要低得多
小世界模型没有关注正确的度数分布
2.4 Kronecker Graph Model
编年史图模型,生成大型真实图
Stochastic Kronecker Graphs
引入随机性,即邻接矩阵内的值不是0或1,而是介于0~1之间的值
快速Kronecker图生成算法
Kronecker图论文 参考博客:https://blog.csdn.net/weixin_45443685/article/details/105738453
另一个比较全面的笔记:https://blog.csdn.net/lssx0817/article/details/106057519/