cs224w 图神经网络学习笔记（十四）Influence Maximization in Networks

最新推荐文章于 2023-09-06 16:08:02 发布

喵木木

最新推荐文章于 2023-09-06 16:08:02 发布

阅读量1.6k

点赞数 5

分类专栏：笔记文章标签：神经网络深度学习机器学习图论

本文链接：https://blog.csdn.net/Jenny_oxaza/article/details/110674395

版权

笔记专栏收录该内容

25 篇文章 38 订阅

订阅专栏

课程链接：CS224W: Machine Learning with Graphs
课程视频：【课程】斯坦福 CS224W: 图机器学习 (2019 秋 | 英字)

1. 前言——Viral Marketing 病毒式营销

很多时候，我们都会因为朋友的安利而去购买某些产品。
在这里插入图片描述
一个很形象的例子就是王妃效应(Kate Middleton effect)——凯特王妃的穿着往往会引领时尚圈的潮流。那么，我们怎么在一张网络中找到这样的Kate呢？

这个问题被定义为 Influence Maximization（社交网络影响力最大化） 问题——在给定的初始网络中给定初始活跃节点的个数 $k$ ，影响力最大化问题即找到固定个数的活跃节点集，通过特定的传播模型进行传播，使得最终活跃节点数目达到最大化。

2. Influence Maximization问题

在这里插入图片描述
下面介绍两个经典的传播模型：

Linear Threshold Model 线性阈值模型

在线性阈值模型中，每个节点 $v$ 都有一个影响阈值 $\theta_v \in U[0,1]$ ，这个阈值在0到1的范围内均匀、随机地选取，一旦确定在传播中就不再改变。

对于节点 $v$ 来说，它的每个邻居节点 $w$ 对它都由一个影响因素 $b_{v,w}$ ，且 $\sum_{w \text{ neighbour of }v} {b_{v,w}} \le1$ 。当周围邻居对该节点的影响超过它的影响阈值时，即 $\sum_{w \text{ neighbour of }v} {b_{v,w}} \ge \theta_v$ 时，该节点被激活。

Independent Cascade Model 独立级联模型
在这里插入图片描述
Influence Maximization问题的难点

这个问题是一个NP问题。——Influence maximization is NP-complete。但是，我们可以用近似算法进行求解。

3. 爬山算法——基于次模函数的研究方法

我们先来看一下爬山算法（Greedy Hill Climbing algorithm）。爬山算法能够达到63%的精度。
在这里插入图片描述

影响最大化的爬山算法是一种基于次模函数的研究方法——PPT中有详细的证明。或者可以看论文：An analysis of approximations for maximizing submodular set functions。