发表在2020年SIGIR
《Detecting User Community in Sparse Domain via Cross-Graph Pairwise Learning》论文阅读笔记
背景:网络空间(以社交媒体和电子商务为例)中包含大量用户和项目交互,这些关系通常用二分图表示。在这种异构图中发现用户社区(发现用户信息,进一步增强推荐性能)是一个关键任务。对于全连接图,使用传统方法就能直接在节点上估计连通性并生成高质量的社区,而对于稀疏连接图,社区发现算法很难得出有用的信息优化社区结构。
存在问题:有些域比较稀疏。用户可能出现在多个域中,密集域中的活动可以在稀疏域中提供社区发现(比如,当用户使用Google ID登录应用时,用户的行为可以帮助成千上万的应用定位他的本地社区)
本文:提出成对交叉图社区发现(PCCD),增强稀疏图中用户社区发现(小型应用可以利用从大型供应商那里继承的用户身份信息)。对于稀疏域中的训练数据不充分,使用新的数据增强方法—跨图点对学习(给定一个用户,同时利用主图(即全连接图)和稀疏图发现社区,此外,考虑到图的局部结构,也能减小噪声)。
具体:用户在短时间内既可能出现在主图中,也可能出现在稀疏图中,这些共同的用户就可以当成是连接两个域的桥梁。共同用户元组:<i,j,k>,与k相比,j与i之间的关系:(1)相似&#x