文章目录
图的知识
什么是图?
G=(V,E),图是由节点和边组成,节点可以代表人,产品,论文等等,边可以表示朋友关系,购买关系等等。
图能用来干什么?
图能用来表示社交网络,购买记录关系,族谱,句子之间单词的关系等等。
图既是一种数学形式,又是一种数据结构(如邻接矩阵),他还是数据自身。我们要从图这种数据中挖掘出价值。
预备知识
如上图,图可以分为有向图和无向图。
如上图,可分为有权图和无权图。
如上图,可分为单一关系和多关系的图。单关系中,有n个节点,那么自然有nxn的邻接矩阵;多关系里面除了nxn,还要乘一个┏,因为每个边的类型不一样。
如上图,Node ID是指第几个节点,而Node Feature是将节点搞成特征向量了,这时节点集合变成了一个nxk的矩阵。
Multi-relational Graph
Heterogeneous Graph(异构图)
看看上面那张图,异构图的节点子集合的并集是总的节点集合,节点子集合与节点子集合间无交集。在第一张图中,有三个节点的集合,他们无交集,然后(u,v,┏)可以唯一确定一条边属于边集合E中,当我知道这条边后,我就能确定这条边的两个顶点以及定点所在的集合。
Multipartite(多部图)
继续看上面那张图,在异构图基础上加了一个条件,就是同一子集合内没有边相连。
Multiplex(多重图)
如上图所示,多重图的各个顶点子集的并集是总的顶点集合,但是,每个子集可能有很多个,就像上面的图一样,假设有三个一样的顶点子集。然后他们边集的集合是总的边集,那个E0表示每一层的图的对应的节点间的边。也就是说当(u,v,┏)属于E0时,那么这两个顶点u和v一定是相对应的。
Graph or Network?
网络是真实世界的,比如社交网络之类的;而图是数学世界的,是将真实的社交网络用数学的形式表示出来。
图上的一些学习任务
先看看图上的信息,对于节点来说,将节点打上标签,然后目标值就为y(vi)。对于边来说,1或0表示有无该边。然后就是将节点与边构成的各个子图组合成完整的图。然后给完整的图打上标签,目标值为y(G)。
无监督学习和监督学习
这个不用多说,看看机器学习入门知识就能理解。
半监督学习
半监督学习综合了无监督和有监督。数据集X里的数据一部分有标签,一部分无标签。所要完成的任务是将无标签的数据打上标签,并且完成映射。
我们将半监督学习看成监督学习用了分布中的额外的一些信息(就是没打标记的数据),或者看成无监督学习做了一些约束,比如对有标记数据的误差的最小化以及平滑程度。