图的概念与主要类型、图模型的应用场景

前言

图(Graph)是一个常见的数据结构,现实世界中有很多任务都可以抽象成图问题,比如社交网络,蛋白体结构,交通路网数据,以及很火的知识图谱等,甚至规则网络结构数据(如图像,视频等)也是图数据的一种特殊形式。

随着数据多样性的发展,图计算已经成为业界的一个重要的研究方向。如大规模图搜索、图数据的代表节点评价、图数据的社区划分、图数据的向量嵌入,基于图的推荐、节点预测、关系预测等实际应用需求的提出,也突出了图算法这一技术的重要性。

知识图谱本质上是一种图结构,在图内部数据规模大且质量高、外部算力足够的情况下,充分利用好图算法,能够最大程度地发挥出其数据价值。知识图谱嵌入、基于知识图谱的推荐、路径关联分析等,都会用到图算法。由于笔者近期也在学习相关的知识,现就假期中阶段性的梳理结果整理出来,分享给大家,希望大家批评指正。

图模型之用武之地:图模型的典型应用场景

目前将图算法模型应用于实际业务中已经被证明是有效的。例如,基于图的团伙挖掘、58和斗鱼直播将图算法应用于广告反作弊、直播反作弊、腾讯将算法应用于网络黑产挖掘,荔枝FM中将图算法应用于推荐、京东的9N算法框架已经被广泛应用于推荐广告、搜索广告、以及其他的站内外广告场景、微信支付基于图计算的反欺诈等。这些场景可以进一步抽象为节点分类、路径预测、社区聚类、节点推荐等几类。其中:

1)节点分类。旨在基于其他标记的节点和网络拓扑来确定节点的标签,例如,与序列自然语言处理类似,将一个文本作为一个图的节点,可应用于主题文本分类,包括新闻分类、Q&A、搜索结果组织。在网络安全攻击中,可以通过已知具有攻击行为的站点来对未知标签的站点进行预测。

2)路径预测。指预测缺失链路或未来可能出现的链路。链路预测场景中主要完成的是对网络中的两个节点是否可能存在链路进行预测。例如,在推荐系统中,我们推荐的是高度“连接”的产品,可以用GNN训练模型来预测这种链路是否存在。

3)社区聚类。用于发现相似节点的子集,并将它们分组在一起。例如,关联关系识别团伙,无监督方法:通过连通子图算法识别出一个个连通的社区,如果社区规模较大,可能背后业务含义是黑产控制一批账户。在具体实现上,可以通过定义社区规模为score,通过调节阈值来控制误杀、召回,从而发现不同的社区及其成员。使用社区聚类的方法,也可以用于文本聚类。

4)节点推荐。根据节点特征以及其他特征进行搜索推荐。例如,在社交人物中的推荐场景中,可以通过一些图结构结合一些算法,比如典型的pagerank算法,找到关键人物,通过对关键人物采取特定性策略(比如定向推广)以提升推荐效果,也可以基于地理、人物任务关系、兴趣爱好组成的圈子,进行产品和广告的推荐。

图模型的应用已扩散到互联网实际场景中,比如阿里巴巴达摩院开发的图计算平台GraphScope,已经证明在多个关键互联网领域 (如风控,电商推荐,广告,网络安全,知识图谱等)实现了重要的业务新价值。GraphScope的代码于

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值