Graph Learning Method
先从Graph基础知识讲起
DeepWalk
算法可以分为四步:
- 图a展示了原始的用户行为序列
- 图b基于这些用户行为序列构建了物品相关图,可以看出,物品A,B之间的边产生的原因就是因为用户U1先后购买了物品A和物品B,所以产生了一条由A到B的有向边。如果后续产生了多条相同的有向边,则有向边的权重被加强。在将所有用户行为序列都转换成物品相关图中的边之后,全局的物品相关图就建立起来了。
- 图c采用随机游走的方式随机选择起始点,重新产生物品序列。
- 图d最终将这些物品序列输入word2vec模型,生成最终的物品Embedding向量。
Node2Vector
提出学习网络的同质性(homophily)和结构性(structural equivalence),将DeepWalk中第三步的随机游走改为宽度/广度优先搜索。
GCN
如果没有Graph,只有CNN的话,网络表示为:
H ( k + 1 ) = f ( H ( k ) ) = σ ( H ( k ) W ( k ) ) H^{(k+1)}=f\left(H^{(k)}\right)=\sigma\left(H^{(k)} W^{(k)}\right) H(k+1)=f(H(k))=σ(H(k)W(k))
Graph Convolutional Network的表示:
H ( k + 1 ) = f ( H ( k ) , A ) = σ ( A H ( k ) W ( k ) ) H^{(k+1)}=f\left(H^{(k)}, A\right)=\sigma\left(A H^{(k)} W^{(k)}\right) H(k+1)=f(H(k),A)=σ(AH(k)W(k))
其实就多了一个矩阵 A A A! A A A是0-1矩阵,0表示两个点无关联,1表示两个点有关联。 A A A用来表征数据之间的关联,是由数据结构先天决定的。
举个例子:
- K=0,0-order,等于不利用图聚合信息,卷积运算矩阵 A A A:
[ α 0 0 0 0 0 0 0 α 0 0 0 0 0 0 0 α 0 0 0 0 0 0 0 α 0 0 0 0 0 0 0 α 0 0 0 0 0 0 0 α 0 ] \left[\begin{array}{cccccc} \alpha_{0} & 0 & 0 & 0 & 0 & 0 \\ 0 & \alpha_{0} & 0 & 0 & 0 & 0 \\ 0 & 0 & \alpha_{0} & 0 & 0 & 0 \\ 0 & 0 & 0 & \alpha_{0} & 0 & 0 \\ 0 & 0 & 0 & 0 & \alpha_{0} & 0 \\ 0 & 0 & 0 & 0 & 0 & \alpha_{0} \end{array}\right] ⎣⎢⎢⎢⎢⎢⎢⎡α0000000α0000000α0000000α000