PageRank算法与Influence Propagation

本文详细介绍了PageRank算法,解释了其核心思想和计算过程,包括入链、出链的概念,以及如何处理无出链和仅对自己出链的情况。同时,讨论了Influence Propagation在社交网络中的应用,特别是独立级联模型(IC模型)和线性阈值模型(LT模型)的影响力最大化问题。
摘要由CSDN通过智能技术生成

 

PageRank算法

PageRank基本理念

PageRank算法的目的是:标记网页的重要性的一种方法,用以衡量网页的质量的好坏,来调整搜索的排序结果,PageRank算法借鉴学术界论文重要性的评估方法:谁被引用的次数多,谁就越重要

核心思想:

(1)如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高

(2)如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高

 

 

  1. 算法原理

几个基本概念:

  • 入链:页面A增加了指向页面B的超链接,则B有来自于A的入链,或用户直接通过url进入B,则为url到B的入链
  • 出链:页面A增加了指向页面B的超链接,则A出链到B
  • 无出链/只对自己出链:页面不再指向新的页面或只指向自己
  • PR值:一个网页的PR值,概率上理解就是此网页被访问的概率,PR值越高其排名越高

 

网页都有出入链

所有的网页都有出链和入链,图是强连通的,从任一点出发可以遍历整个图,为了简化计算

我们可以假设当一个用户停留在某页面时,他跳转到页面所指向的其他页面的概率是相同的

即上图中页面B有两个出链,则从B跳转到A和B跳转到D的概率为相同,为1/2

计算页面A的PR值:PR(A) = PR(C) + PR(B)/2

如此我们可以用转移矩阵来描述页面之间跳转的概率

 

 

其中 的值表示用户从页面j跳转到页面i的概率

假设初始时刻

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值