PageRank

最新推荐文章于 2020-11-18 00:52:08 发布

zhulinniao

最新推荐文章于 2020-11-18 00:52:08 发布

阅读量221

点赞数 1

分类专栏：推荐排序

【博客公式均自己亲自推导和撰写，请转载请注明出处，文章如有侵权、未引用出处等请及时联系whaozl@126.com 或留言评论】【很多已会但是会忘,写纯粹是为了多总结多向前看看和向后看看】

本文链接：https://blog.csdn.net/zhulinniao/article/details/103651620

版权

推荐排序专栏收录该内容

1 篇文章 0 订阅

订阅专栏

PageRank

1 PageRank
- 1.1 算法原理
- 1.2 线代法求解
Reference

1 PageRank

rank(排序学习) 有 pageRank、Learning To Rank(LTR)等
rank类型pointwise pairwise listwise三者区别

1.1 算法原理

PageRank公式推导 详解PageRank：随机游走模型一
迭代法求解出最终页面评分 PageRank算法原理与实现

$PR(A)=(1-d)\frac{1}{N}+d\left( PR({{T}_{1}})\frac{1}{C({{T}_{1}})}+\cdots +PR({{T}_{n}})\frac{1}{C({{T}_{n}})} \right)$
$P R (A)$ 页面A的 $P R$ 值
$PR({T_i})$ 页面 $T_i$ 的 $P R$ 值，在这里，是页面 $T_i$ 在指向 $A$ 的所有页面中的某个页面
$C(T_i)$ 页面 $T_i$ 的出度(从 $T_i$ 链接出页面的个数)
$d$ 阻尼系数，其意义是，在任何时刻，用户到达某页面后并继续向后浏览的概率，该数值是根据上网者使用浏览器书签的平均频率估算而得，通常 $d = 0.85$

1.2 线代法求解

在这里插入图片描述
图解释：A点有两条出路径到B和C点(概率各取1/2)，B点只有一条路径到C(概率全为1)，其他类推，则得到该网络的转移矩阵：
$M=\left[ \begin{matrix} {} & A\to ? & B\to ? & C\to ? \\ A & 0 & 0 & 1 \\ B & 1/2 & 0 & 0 \\ C & 1/2 & 1 & 0 \\ \end{matrix} \right]\text{=}\left[ \begin{matrix} 0 & 0 & 1 \\ 1/2 & 0 & 0 \\ 1/2 & 1 & 0 \\ \end{matrix} \right]$
则可将上面的公式进一步推导为：
$PR_{t+1}=(1-d)\frac{1}{N}+d*M\cdot PR_t$
采用线性代数法，直接求 $PR_t$ ，得到：
$PR_{t}=(1-d)\frac{1}{N}+d * M\cdot PR_t$
于是( 令 $P R$ 为 $R$ )：
$(E-dM)R=\frac{(1-d)}{n}E \\ \\ R={{(E-d M)}^{-1}}\frac{1-d}{n}E$
则当 $0 < d < 1$ 时,如上方程解存在且唯一，这样 ${{(E-d M)}^{-1}}$ 是逆矩阵就成立啦。幕法求解不作介绍。