概要+图基本知识
为什么将数据表示为图结构
一系列真实世界的问题可以作为图上的计算任务。
图上的节点是内在连接的,这表明节点不是独立的和相同分布的。因此,传统ML是不能直接应用于图计算任务上的。对于此问题,我们有宏观和微观两套方案:1)是构建一个新的、特定于图的机制:使用集体分类;2)通过构建一系列的特征来表示其节点,实现图的展开,这样就可以使用传统ML方法。
图上的特征学习
对于图节点的特征嵌入,有两种方式:1)特征工程:依赖于手工设计的特征,例如:节点度统计;2)特征学习:特征学习是自动地学习节点特征。
图特性与度量标准
节点的度
节点在一个图中的度表示该节点与其它节点相邻接的频率。定义如下:
d ( v i ) = ∑ v j ∈ V I ϵ ( v i , v j ) d(v_i)= \sum_{v_j{\in}V}I_{\epsilon}({v_i, v_j}) d(vi)=vj∈V∑Iϵ(vi,vj)
其中, I ϵ I_{\epsilon} Iϵ是一个指示函数:
I ϵ ( v i , v j ) = { 1 , i f ( v i