斯坦福CS224W图机器学习Lecture 14-influence学习笔记

最新推荐文章于 2022-09-11 14:42:14 发布

xuan_ting

最新推荐文章于 2022-09-11 14:42:14 发布

阅读量932

点赞数 1

分类专栏：浅谈文章标签：算法网络图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuan_ting/article/details/108458732

版权

浅谈专栏收录该内容

23 篇文章 1 订阅

订阅专栏

课程Lecture 14的内容是Influence maximization，探讨网络中影响力最大化的问题。我主要分为以下几部分进行总结。

引入：Viral Marketing

病毒式营销步骤：
（1）识别有影响力的客户；
（2）通过提供折扣或免费样品，说服他们采用产品；
（3）这些客户会在在他们的朋友中宣传这个产品。
在这里插入图片描述

传播模型

存在边(𝑣,𝑤)，表示活跃节点𝑣有一定权重或者概率可以影响𝑤。

1.Linear Threshold Model线性阈值模型

在这里插入图片描述
注：只计算为active状态的邻居节点权重和

例子：
（1）初始只有节点𝑉是active状态。
在这里插入图片描述
（2）节点𝑉对节点𝑈、𝑊都有一定影响，但是只有对𝑊 的影响权重超过了它的阈值，因此𝑊被激活。

（3）节点𝑊对邻居节点𝑈、𝑋也产生影响，节点𝑈同时受到节点𝑉和𝑊的影响，权重和超过其阈值，因此也被激活。
在这里插入图片描述
（4）终止条件：找不到可以变成active状态的节点了。

2.Independent Cascade Model独立级联模型

条件： 给定有向图𝐺=(𝑉,𝐸)，以及active状态的节点集𝑆。
过程： 节点对之间的边(𝑣,𝑤)有一个概率p_𝑣𝑤 表示激活概率。由𝑆中的节点出发，成功激活新节点则加入𝑆，直到没有可激活的节点时结束。
特点：
（1）当节点𝑣是active状态时，对邻居𝑤只有一次激活的机会，概率是p_𝑣𝑤 。
（2）这个模型里的顺序不影响结果。比如 𝑢,𝑣 都是已激活节点，它们有共同的邻居𝑤,那么谁先尝试激活 𝑤 都是可以的。

例子：
（1）𝑎是初始的active节点；
（2）𝑎激活了𝑒，但是没有成功激活𝑑；
（3）𝑒继续激活了𝑓和𝑔；
（4）结束。
在这里插入图片描述

红色边：成功激活的边
灰色边：使用过但是没有成功激活
黄色边：没有使用过的边

Influence Maximization 优化问题

问题定义：
给定一个有向图和𝑘值(𝑘>0)，找到大小为𝑘的最有影响力的集合 𝑆，使𝑓(𝑆)最大。
在这里插入图片描述
𝑋𝑢:节点𝑢经过可激活的边所能到达的所有节点集合

求解S

由于是NP完全问题，所以用近似算法求解。

1.Greedy Hill Climbing Algorithm 贪心爬山算法

初始输入：每个节点𝑢的影响集𝑋𝑢
核心思想：从𝑆为空集开始，每一轮找到一个能激活最多额外节点的节点𝑢，激活它并添加到𝑆，直到找到𝑘个节点结束。
在这里插入图片描述

Approximation Guarantee 性质

在这里插入图片描述

【贪心算法的性质证明】

子模函数的2个基本定理：
在这里插入图片描述

（1）证明𝑓(𝑆)是子模函数

在这里插入图片描述

（2）证明贪心爬山算法是近似最优解

在这里插入图片描述
e是自然对数的底，详细证明可以看斯坦福课程网站上的handout。

【评价贪心爬山算法】

- 优点

通过模拟得到了非常好的近似结果，至少可以达到最优结果的63%。
在这里插入图片描述

- 缺点

非常慢！时间复杂度很高！𝑂(𝑘𝑛𝑅𝑚)
𝑘 ：初始选定的𝑆集节点数
𝑛 ：图中总节点数
𝑅 ：模拟的回合数（平行世界个数）
𝑚：图中边的数量

2.Sketch-based Algorithm ：对贪心爬山算法的改进

贪心算法的缺点：每次在possible world中计算影响集𝑋u时，时间复杂度是 𝑂(𝑚)。
解决方法：用一个small structure - sketch来替代节点𝑢的影响力。

参考论文：
“Sketch-based Influence Maximization and Computation: Scaling up with Guarantees”,CIKM2014

可达性草图 – 贪心算法的预处理步骤

如果一个节点传播的范围更广的话，它有更大的概率到达那些rank值很小的节点。因此可以通过对点按更新的值进行升序排序，值越小的节点影响力越大。
在这里插入图片描述

基于sketch的算法

（1）构建有𝑐个rank值的可达性草图 – 减小误差
在这里插入图片描述
（2）使用贪心算法，每一回合寻找向量中有最小rank的节点𝑢加入𝑆

（3）删除𝑢的影响集𝑋𝑢节点。如果其他节点的rank中有𝑋𝑢中节点的number, 则删除这些number，因为后面回合选择的新节点𝑣不应和𝑢有太多重复的影响范围。

Eg: 有节点𝑢,𝑣(0.2,0.3,0.6) ， 𝑣中的 0.3和0.6代表的节点同时也是𝑋𝑢 中的节点，𝑣∉ 𝑋𝑢。选中𝑢后，则要删除𝑣中的 0.3和0.6。

评价基于sketch的算法

它是贪心算法的近似，效果取决于保留的rank数量(即参数𝑐)。
在这里插入图片描述

Influence Maximization的未来研究方向

在这里插入图片描述

课程资源

CS224W: Machine Learning with Graphs (Stanford / Fall 2019)
课程链接：CS224W: Machine Learning with Graphs
http://web.stanford.edu/class/cs224w/index.html#content
课程视频：【课程】斯坦福 CS224W: 图机器学习 (2019 秋 | 英字)
https://www.bilibili.com/video/BV1DE411W7J8?p=1

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
斯坦福CS224W图机器学习Lecture 14-influence学习笔记

课程Lecture 14的内容是Influence maximization，探讨网络中影响力最大化的问题。我主要分为以下几部分进行总结。课程资源CS224W: Machine Learning with Graphs (Stanford / Fall 2019)课程链接：CS224W: Machine Learning with Graphshttp://web.stanford.edu/class/cs224w/index.html#content课程视频：【课程】斯坦福 CS224W
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。