来自知乎高赞回答
作者:张小磊
链接:https://www.zhihu.com/question/270000965/answer/351213729
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
网络表示学习(Network Representation Learning),又名网络嵌入(Network Embedding)、图嵌入(Graph Embedding),它旨在将网络中的节点表示成低维、实值、稠密的向量形式,使得得到的向量形式可以在向量空间中具有表示以及推理的能力,同时可轻松方便的作为机器学习模型的输入,进而可将得到的向量表示运用到社交网络中常见的应用中,如可视化任务、节点分类任务、链接预测以及社区发现等任务,还可以作为社交边信息应用到推荐系统等其他常见任务中。网络表示学习是一种分布式的表示学习技术。网络表示学习是表示学习技术的一个子集。表示学习是一种对于数据广义的特征表示,可以是对于网络结构的表示(邻接矩阵),也可以是对于列表结构的表示(链表);可以是对于文本的特征描述(TF-IDF),也可以是对于图像的特征表示(SIFT); 可以是人工制造的特征(特征工程),也可以是自动学习到的隐含特征(矩阵分解); 可以是无监督的特征表示(AutoEncoder),也可以是监督的降维表示(LDA);可以是局部的流形学习方法(LLE),也可是全局的特征表示方法(SVD); 可以是线性的表示方法(PCA),也可以是高度非线性的自动学习方法(CNN)。 而网络表示学习则更加专注于社交网络的表示,旨在将网络中的节点以更加直观、更加高效的某种方式尽可能的还原原始空间中节点的关系。网络表示学习是对于节点的一种分布式表示方案。分布式表示与之相对应的概念为离散的表示方法。离散的表示方法侧重于对每个对象进行单独建模,常见的离散表示方法有one-hot表示,bag of words和TF-IDF等,比如star和sun的离散式表示如图1,由于只有在该位置出现的地方为1,其他维度都为0,因此star和sun的语义尽管有些相近,但计算相似度时仍然为0。分布式表示是基于通过与他周围同时出现的词来表示它,它是基于分布式假设被John Rupert Firth提出的-You shall know a word by the company it keeps.比如拿‘’银行‘’举例,经常与它一同出现的词为“政府、借贷、存款”等,这样一来两个相似的词就不会出现相似度完全为0的情况,star和sun的分布式表示如图3。分布式表示相比于离散的表示方法有如下优点:维度大大减小,语义信息相对保留。
至于其代表方法及分类详见网络表示学习概述