链接算法之PageRank算法原理和应用

目录

算法简介

算法原理

简单实现

优缺点

算法简介

PageRank算法基于 “从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系,来判定网页的重要性
 
有以下两个影响因素:
数量因素 :一 个页面节点接收到的入链数量越多,这个页面越重要
质量因素:指向页面 A 的入链质量不同,越是质量高的页面指向页面 A ,则页面 A 越重要

 

算法原理

假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。
 
重新假设B链接到A和C,C只链接到A,并且D链接到全部其他的3个页面。一个页面总共只有一票。所以B给A和C每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值