DeepWalk: Online Learning of Social Representations
Bryan Perozzi, Rami Al-Rfou, Steven Skiena
Stony Brook University
https://www.cse.fau.edu/~xqzhu/courses/cap6315/deepwalk.pdf
这篇文章介绍下DeepWalk,它是一种新的学习网络中节点的隐含表示的方法。
这些隐含表示将社交关系编码到连续向量空间中,在统计模型中比较容易应用。DeepWalk在语言模型以及通过无监督特征学习从单词序列到图中取得了不错的效果。
DeepWalk利用截断随机游走得到的局部信息,通过将游走作为句子来学习隐含表示。作者们在多个社交网络多标签网络分类任务中,比如BlogCatalog、Flickr以及YouTube,利用DeepWalk得到了隐含表示。结果表明,DeepWalk效果优于一些baselines,DeepWalk可以得到网络的全局视角,尤其是包含隐含信息的情况中。
DeepWalk的隐含表示,在标注数据稀疏的场景中,相对其他方法,F1得分可以提升10%。在一些实验中,在训练数据少了60%的前提下,DeepWalk的表示效果仍然可以优于其它基准方法。
DeepWalk扩展性也比较好,它是一种在线学习算法,可以得到有用的增量效果,可以并行实现。这些特性,使其适用于很多实际应用中,比如网络分类以及异常检测。
DeepWalk效果图示如下
这篇文章的主要贡献如下
一些符号约定如下
DeepWalk所学隐含表示具有以下特性
随机游走使得deepwalk具有以下两个特性
幂率分布图示如下
DeepWalk算法伪代码如下
SkipGram算法伪代码如下
DeepWalk算法图示如下
数据集信息简介如下
参与对比的几种方法简介如下
几种方法在多标签分类问题中的效果对比如下
不同参数对模型效果影响如下
代码地址
https://github.com/phanein/deepwalk
我是分割线
您可能感兴趣
密歇根州立大学联合京东提出深度强化学习算法DeepPage用于分页推荐
诺亚方舟实验室提出数值特征自动离散框架AutoDis用于CTR预估
密歇根州立大学联合领英提出基于AutoML的Embedding框架AutoDim