图机器学习 - cs224w Lecture 11 & 12 - 网络传播

转载请注明出处:https://blog.csdn.net/New2World/article/details/106265878

我们研究网络,不仅是为了提取网络结构的特征或对节点进行分类。更多的是为了研究网络上的传播过程,比如消息在社交网络中的传播,以及传染病在人群中的传播。而现实世界中的网络是不会显式地表现出传播过程的,而是通过时间先后的关系展示出传播性的。

Decision Based Model of Diffusion

现在有两种选择 A 和 B,一个人现在要决定要么选 A 要么选 B。如果你的朋友和你做出同样的选择那么能得到一定的奖励,否则没有奖励。就像分系统的手游,你用 IOS 你可以和你周围用 IOS 的朋友一起玩,开心;但这样就失去了 Android 的朋友。那么用数学来描述就是,选 A 能得到 a 的 payoff,B 能得到 b。然后你有 d 个朋友,他们之中选择 A 的占比例 p,那么

p a y o f f = { a ⋅ p ⋅ d      c h o o s e A b ⋅ ( 1 − p ) ⋅ d      c h o o s e B payoff = \begin{cases}a\cdot p\cdot d\ \ \ \ choose A\\ b\cdot (1-p)\cdot d\end{cases}\ \ \ \ choose B payoff={ apd    chooseAb(1p)d    chooseB

其实通过 a 和 b 的大小就能判断出为了将利益最大化是应该选 A 还是选 B。先定义一个阈值 q = b a + b q = \frac b{a+b} q=a+bb,如果 p 大于这个阈值就说明选择 A 更有利,而当小于阈值时选择 B 得到的回报更多。那么为了简化问题,我们假设 a = b − ϵ a = b-\epsilon a=bϵ 即 a b 基本相等,且 q = 1 / 2 q = 1/2 q=1/2。这就变成了一个“从众”的问题了,即选哪个的人多我选哪个。

这里选择了 2011 年 Twitter 上西班牙在经济危机期间爆发的大规模抗议的话题为例。对使用了对应话题的 hashtag 的用户及用户间关系进行分析。定义两个符号 k i n k_{in} kin 表示当一个用户开始参加抗议活动时他有多少好友,以及 k a k_a ka 此刻他有多少已经参加抗议了的朋友。然后将两个值的比定义为 activation threshold k a / k i n k_a/k_{in} ka/kin 表示参加抗议的朋友占多大比例的时候,一个人可能会跟着一起参加。如果这个阈值趋近 0 0 0 说明他可能是发起者之一;而如果趋近 1 1 1 说明他受到了很大的“社会压力”,可能是“被迫”参加的抗议。下面这张图能看出很多人在超过半数的朋友参加后参加的,也有很多人是自发参加的。

另一个假说是当很多朋友在短时间内都参加了抗议那这个用户大概率也会参加。而下面这个图有印证了这一点。注意纵坐标是累计的 Δ k a / k a = ( k a t + 1 − k a t ) / k a t + 1 \Delta k_a/k_a=(k_a^{t+1}-k_a^t)/k_a^{t+1} Δka/ka=(kat+1k

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值