Mining of Massive Dataset----PageRank的两种问题spider traps和dead ends

 

PageRank的两种问题

 

  •   spider traps(蛛网陷阱)

      在几个网页的节点之间跳转,经过一段很长的时间之后,只能在节点n来回跳转(也就是说不嫩访问到其他的网页,只能点击访问节点n这个网页)。

  解决方法:

    在访问节点n的几率接近于1的时候,让他随机的跳转到任意一个网页(唉网页可以不在这些几点网页中)。

  •      dead ends 

    在几个网页的节点之间跳转,经过一段很长的时间之后,没有出路了,连几点n这个网页也不能访问。

  解决方法:

    判断网页节点矩阵M中是否有一列全部是0,如果有,则将这一列的值全部替换成1/n。

    

  

注释:

  设有n个网页作为节点,这些网页之间的链接作为线,构成的图是一个有向图。矩阵M表示这些点和线之间的关系。

  拿第一个例子来说,点y可以到达点y自己和点a,不能到达点m,所以第一列的值是1/2,1/2,0。点a可以到达点y和点m,不嫩到达点a自己,所以第二列的值是1/2, 0 ,1/2。而点m的出度是0,所以第三列的值全部是0。(是按照列来看的,不知道为什么要这样~)

  

  如下是一个dead ends的例子.

 

 

  下面是一个spider traps的例子。

 

转载于:https://www.cnblogs.com/z-j-n-2015/p/4960319.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值