斯坦福CS224W图机器学习Lecture 14-influence学习笔记

课程Lecture 14的内容是Influence maximization,探讨网络中影响力最大化的问题。我主要分为以下几部分进行总结。

引入:Viral Marketing

病毒式营销步骤:
(1)识别有影响力的客户;
(2)通过提供折扣或免费样品,说服他们采用产品;
(3)这些客户会在在他们的朋友中宣传这个产品。
在这里插入图片描述

传播模型

存在边(𝑣,𝑤),表示活跃节点𝑣有一定权重或者概率可以影响𝑤。

1.Linear Threshold Model线性阈值模型

在这里插入图片描述
注:只计算为active状态的邻居节点权重和

例子:
(1)初始只有节点𝑉是active状态。
在这里插入图片描述
(2)节点𝑉对节点𝑈、𝑊都有一定影响,但是只有对𝑊 的影响权重超过了它的阈值,因此𝑊被激活。
在这里插入图片描述
(3)节点𝑊对邻居节点𝑈、𝑋也产生影响,节点𝑈同时受到节点𝑉和𝑊的影响,权重和超过其阈值,因此也被激活。
在这里插入图片描述
(4)终止条件:找不到可以变成active状态的节点了 。
在这里插入图片描述

2.Independent Cascade Model独立级联模型

条件: 给定有向图𝐺=(𝑉,𝐸),以及active状态的节点集𝑆。
过程: 节点对之间的边(𝑣,𝑤)有一个概率p_𝑣𝑤 表示激活概率。由𝑆中的 节点出发,成功激活新节点则加入𝑆,直到没有可激活的节点 时结束。
特点:
(1)当节点𝑣是active状态时,对邻居𝑤只有一次激活的机会,概率是p_𝑣𝑤 。
(2)这个模型里的顺序不影响结果。比如 𝑢,𝑣 都是已激活节点,它们有共同的邻居𝑤,那么谁先尝试激活 𝑤 都是可以的。

例子:
(1)𝑎是初始的active节点;
(2)𝑎激活了𝑒,但是没有成功激活𝑑;
(3)𝑒继续激活了𝑓和𝑔;
(4)结束。
在这里插入图片描述

  • 红色边:成功激活的边
  • 灰色边:使用过但是没有成功激活
  • 黄色边:没有使用过的边

Influence Maximization 优化问题

问题定义:
给定一个有向图和𝑘值(𝑘>0),找到大小为𝑘的最有影响力的集合 𝑆,使𝑓(𝑆)最大。
在这里插入图片描述
𝑋𝑢:节点𝑢经过可激活的边所能到达的所有节点集合
在这里插入图片描述
在这里插入图片描述

求解S

由于是NP完全问题,所以用近似算法求解。

1.Greedy Hill Climbing Algorithm 贪心爬山算法

初始输入:每个节点𝑢的影响集𝑋𝑢
核心思想:从𝑆为空集开始,每一轮找到一个能激活最多额外节点的 节点𝑢,激活它并添加到𝑆,直到找到𝑘个节点结束。
在这里插入图片描述

Approximation Guarantee 性质

在这里插入图片描述

【贪心算法的性质证明】

子模函数的2个基本定理:
在这里插入图片描述
在这里插入图片描述

(1)证明𝑓(𝑆)是子模函数

在这里插入图片描述

(2)证明贪心爬山算法是近似最优解

在这里插入图片描述
e是自然对数的底,详细证明可以看斯坦福课程网站上的handout。

【评价贪心爬山算法】

- 优点

通过模拟得到了非常好的近似结果 ,至少可以达到最优结果的63%。
在这里插入图片描述

- 缺点

非常慢!时间复杂度很高!𝑂(𝑘𝑛𝑅𝑚)
𝑘 :初始选定的𝑆集节点数
𝑛 :图中总节点数
𝑅 :模拟的回合数(平行世界个数)
𝑚:图中边的数量

2.Sketch-based Algorithm :对贪心爬山算法的改进

贪心算法的缺点:每次在possible world中计算影响集𝑋u时,时间复杂度是 𝑂(𝑚)。
解决方法:用一个small structure - sketch来替代节点𝑢的影响力。

参考论文:
“Sketch-based Influence Maximization and Computation: Scaling up with Guarantees”,CIKM2014

可达性草图 – 贪心算法的预处理步骤

如果一个节点传播的范围更广的话,它有更大的概率到达那些rank值很小的节点。因此可以通过对点按更新的值进行升序排序,值越小的节点影响力越大。
在这里插入图片描述

基于sketch的算法

(1)构建有𝑐个rank值的可达性草图 – 减小误差
在这里插入图片描述
(2)使用贪心算法,每一回合寻找向量中有最小rank的节点𝑢加入𝑆
在这里插入图片描述
(3)删除𝑢的影响集𝑋𝑢节点。如果其他节点的rank中有𝑋𝑢中节点的number, 则删除这些number,因为后面回合选择的新节点𝑣不应和𝑢有太多重复的影响范围。

Eg: 有节点𝑢,𝑣(0.2,0.3,0.6) , 𝑣中的 0.3和0.6代表的节点同时也是𝑋𝑢 中的节点,𝑣∉ 𝑋𝑢。选中𝑢后,则要删除𝑣中的 0.3和0.6。

评价基于sketch的算法

它是贪心算法的近似,效果取决于保留的rank数量(即参数𝑐)。
在这里插入图片描述

Influence Maximization的未来研究方向

在这里插入图片描述

课程资源
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值