1,pagerank介绍
不依靠网页的内容,依靠网路的结构
2 pagerank举例
举个例子:
每一个状态的变化都是来自于它的入边
经过很多次不同状态信息的传送,最终会达到稳定状态
解得答案为:
3 1维和大于1维特征空间对应的PageRank
特征空间也分1维和大于1维
一维空间(ranking唯一)
多维空间(ranking不唯一)
4 实际的PageRank
A是上面那个例子里面的矩阵,hiperlink互相指的那个关联矩阵
m是一个人为给定的常数
S的尺寸和A一致,一个n*n的矩阵,每个元素的值都是1/n
这个是什么意思呢?就是我一个人,我可以按照hiperlink的关联前往下一个网站,我也可以随机跳转到任何一个网站(前者就是第一个式子,后者就是第二个式子)
此时特征值为1对应的特征向量维度为1
那么怎么找此时对应的特征向量呢?(不断迭代,他会很快收敛)
4.1 为什么需要随机浏览?解决 rank leak 与 rank sink 问题
rank leak—— 如果一个网页没有出链,那么它在每一轮迭代中,都会吸收其他网页的影响力而不释放,最终导致其他的网页的page rank值趋近于0
rank sink——如果一个网络没有入链,那么它在每一轮迭代中,都向外释放自己的影响力,但自己没有增加和吸收,最终自己的page rank值趋近于0