课程Lecture 14的内容是Influence maximization,探讨网络中影响力最大化的问题。我主要分为以下几部分进行总结。
引入:Viral Marketing
病毒式营销步骤:
(1)识别有影响力的客户;
(2)通过提供折扣或免费样品,说服他们采用产品;
(3)这些客户会在在他们的朋友中宣传这个产品。
传播模型
存在边(𝑣,𝑤),表示活跃节点𝑣有一定权重或者概率可以影响𝑤。
1.Linear Threshold Model线性阈值模型
注:只计算为active状态的邻居节点权重和
例子:
(1)初始只有节点𝑉是active状态。
(2)节点𝑉对节点𝑈、𝑊都有一定影响,但是只有对𝑊 的影响权重超过了它的阈值,因此𝑊被激活。
(3)节点𝑊对邻居节点𝑈、𝑋也产生影响,节点𝑈同时受到节点𝑉和𝑊的影响,权重和超过其阈值,因此也被激活。
(4)终止条件:找不到可以变成active状态的节点了 。
2.Independent Cascade Model独立级联模型
条件: 给定有向图𝐺=(𝑉,𝐸),以及active状态的节点集𝑆。
过程: 节点对之间的边(𝑣,𝑤)有一个概率p_𝑣𝑤 表示激活概率。由𝑆中的 节点出发,成功激活新节点则加入𝑆,直到没有可激活的节点 时结束。
特点:
(1)当节点𝑣是active状态时,对邻居𝑤只有一次激活的机会,概率是p_𝑣𝑤 。
(2)这个模型里的顺序不影响结果。比如 𝑢,𝑣 都是已激活节点,它们有共同的邻居𝑤,那么谁先尝试激活 𝑤 都是可以的。
例子:
(1)𝑎是初始的active节点;
(2)𝑎激活了𝑒,但是没有成功激活𝑑;
(3)𝑒继续激活了𝑓和𝑔;
(4)结束。
- 红色边:成功激活的边
- 灰色边:使用过但是没有成功激活
- 黄色边:没有使用过的边
Influence Maximization 优化问题
问题定义:
给定一个有向图和𝑘值(𝑘>0),找到大小为𝑘的最有影响力的集合 𝑆,使𝑓(𝑆)最大。
𝑋𝑢:节点𝑢经过可激活的边所能到达的所有节点集合
求解S
由于是NP完全问题,所以用近似算法求解。
1.Greedy Hill Climbing Algorithm 贪心爬山算法
初始输入:每个节点𝑢的影响集𝑋𝑢
核心思想:从𝑆为空集开始,每一轮找到一个能激活最多额外节点的 节点𝑢,激活它并添加到𝑆,直到找到𝑘个节点结束。
Approximation Guarantee 性质
【贪心算法的性质证明】
子模函数的2个基本定理:
(1)证明𝑓(𝑆)是子模函数
(2)证明贪心爬山算法是近似最优解
e是自然对数的底,详细证明可以看斯坦福课程网站上的handout。
【评价贪心爬山算法】
- 优点
通过模拟得到了非常好的近似结果 ,至少可以达到最优结果的63%。
- 缺点
非常慢!时间复杂度很高!𝑂(𝑘𝑛𝑅𝑚)
𝑘 :初始选定的𝑆集节点数
𝑛 :图中总节点数
𝑅 :模拟的回合数(平行世界个数)
𝑚:图中边的数量
2.Sketch-based Algorithm :对贪心爬山算法的改进
贪心算法的缺点:每次在possible world中计算影响集𝑋u时,时间复杂度是 𝑂(𝑚)。
解决方法:用一个small structure - sketch来替代节点𝑢的影响力。
参考论文:
“Sketch-based Influence Maximization and Computation: Scaling up with Guarantees”,CIKM2014
可达性草图 – 贪心算法的预处理步骤
如果一个节点传播的范围更广的话,它有更大的概率到达那些rank值很小的节点。因此可以通过对点按更新的值进行升序排序,值越小的节点影响力越大。
基于sketch的算法
(1)构建有𝑐个rank值的可达性草图 – 减小误差
(2)使用贪心算法,每一回合寻找向量中有最小rank的节点𝑢加入𝑆
(3)删除𝑢的影响集𝑋𝑢节点。如果其他节点的rank中有𝑋𝑢中节点的number, 则删除这些number,因为后面回合选择的新节点𝑣不应和𝑢有太多重复的影响范围。
Eg: 有节点𝑢,𝑣(0.2,0.3,0.6) , 𝑣中的 0.3和0.6代表的节点同时也是𝑋𝑢 中的节点,𝑣∉ 𝑋𝑢。选中𝑢后,则要删除𝑣中的 0.3和0.6。
评价基于sketch的算法
它是贪心算法的近似,效果取决于保留的rank数量(即参数𝑐)。
Influence Maximization的未来研究方向
课程资源
-
CS224W: Machine Learning with Graphs (Stanford / Fall 2019)
课程链接:CS224W: Machine Learning with Graphs
http://web.stanford.edu/class/cs224w/index.html#content -
课程视频:【课程】斯坦福 CS224W: 图机器学习 (2019 秋 | 英字)
https://www.bilibili.com/video/BV1DE411W7J8?p=1