【1】pageRank 是链接的思想:
如果一个网页的入链越多,别的网页引用他越多,它越重要。(重要一定程度上可以理解为随机冲浪者处于各网站的概率)
一个重要的网页链接到一个其他网页,那么被链接到的网页也就越重要。
【2】web有向图:把网页当成点,如果存在网页间的链接,那么这两点存在一条有向边。
【3】web转移矩阵W:P129,如果节点i有k条出链,则每一条出链的权值为1/k,非出链的权值为0。(实际的意义为从网页i链接到其他各网页的概率,在简单的概率相等情况下)
【4】概率角度解释:假设随机冲浪者处于n个网页的概率相等,初始的概率分布V均为1/n。那么通过转移矩阵W,访问一次后处于各网页的就是W*V,i次后就是(W^i)*V。可以用(W^i)*V衡量经过i次访问后,处于各网页的概率,也就得出了各网页的重要性。
【5】上述行为实际上是一个马尔可夫过程,经过发现如果图是一个强连通图且不存在不出链的节点的。那么(W^i)*V将逼近于极限分布,W*V=V。
【6】现在已知 W*V=V,其中V是未知参数,而W是转移矩阵已知。如何求V。
(1)(W-1)V=0,解方程组,但是由于实际W太大,无法解
(2)特征向量 W*V=1*V,V为特征值1所对应的特征向量。