PageRank
1 PageRank
rank(排序学习) 有 pageRank、Learning To Rank(LTR)等
rank类型pointwise pairwise listwise三者区别
1.1 算法原理
PageRank公式推导 详解PageRank:随机游走模型一
迭代法求解出最终页面评分 PageRank算法原理与实现
P
R
(
A
)
=
(
1
−
d
)
1
N
+
d
(
P
R
(
T
1
)
1
C
(
T
1
)
+
⋯
+
P
R
(
T
n
)
1
C
(
T
n
)
)
PR(A)=(1-d)\frac{1}{N}+d\left( PR({{T}_{1}})\frac{1}{C({{T}_{1}})}+\cdots +PR({{T}_{n}})\frac{1}{C({{T}_{n}})} \right)
PR(A)=(1−d)N1+d(PR(T1)C(T1)1+⋯+PR(Tn)C(Tn)1)
P
R
(
A
)
PR(A)
PR(A) 页面A的
P
R
PR
PR值
P
R
(
T
i
)
PR({T_i})
PR(Ti) 页面
T
i
T_i
Ti的
P
R
PR
PR值,在这里,是页面
T
i
T_i
Ti在指向
A
A
A的所有页面中的某个页面
C
(
T
i
)
C(T_i)
C(Ti) 页面
T
i
T_i
Ti的出度(从
T
i
T_i
Ti链接出页面的个数)
d
d
d 阻尼系数,其意义是,在任何时刻,用户到达某页面后并继续向后浏览的概率,该数值是根据上网者使用浏览器书签的平均频率估算而得,通常
d
=
0.85
d=0.85
d=0.85
1.2 线代法求解
图解释:A点有两条出路径到B和C点(概率各取1/2),B点只有一条路径到C(概率全为1),其他类推,则得到该网络的转移矩阵:
M
=
[
A
→
?
B
→
?
C
→
?
A
0
0
1
B
1
/
2
0
0
C
1
/
2
1
0
]
=
[
0
0
1
1
/
2
0
0
1
/
2
1
0
]
M=\left[ \begin{matrix} {} & A\to ? & B\to ? & C\to ? \\ A & 0 & 0 & 1 \\ B & 1/2 & 0 & 0 \\ C & 1/2 & 1 & 0 \\ \end{matrix} \right]\text{=}\left[ \begin{matrix} 0 & 0 & 1 \\ 1/2 & 0 & 0 \\ 1/2 & 1 & 0 \\ \end{matrix} \right]
M=⎣⎢⎢⎡ABCA→?01/21/2B→?001C→?100⎦⎥⎥⎤=⎣⎡01/21/2001100⎦⎤
则可将上面的公式进一步推导为:
P
R
t
+
1
=
(
1
−
d
)
1
N
+
d
∗
M
⋅
P
R
t
PR_{t+1}=(1-d)\frac{1}{N}+d*M\cdot PR_t
PRt+1=(1−d)N1+d∗M⋅PRt
采用线性代数法,直接求
P
R
t
PR_t
PRt,得到:
P
R
t
=
(
1
−
d
)
1
N
+
d
∗
M
⋅
P
R
t
PR_{t}=(1-d)\frac{1}{N}+d * M\cdot PR_t
PRt=(1−d)N1+d∗M⋅PRt
于是( 令
P
R
PR
PR为
R
R
R ):
(
E
−
d
M
)
R
=
(
1
−
d
)
n
E
R
=
(
E
−
d
M
)
−
1
1
−
d
n
E
(E-dM)R=\frac{(1-d)}{n}E \\ \\ R={{(E-d M)}^{-1}}\frac{1-d}{n}E
(E−dM)R=n(1−d)ER=(E−dM)−1n1−dE
则当
0
<
d
<
1
0<d<1
0<d<1时,如上方程解存在且唯一,这样
(
E
−
d
M
)
−
1
{{(E-d M)}^{-1}}
(E−dM)−1是逆矩阵就成立啦。幕法求解不作介绍。
Reference
李航.机器学习
详解PageRank:随机游走模型一
PageRank算法原理与实现
pointwise pairwise listwise三者区别