背景
pageRank 是Google CEO 拉里佩奇提出的一种算法,来计算互联网里的网站的重要性,以对搜索进行排名。
为何叫pagerank,因为是以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。所以为了出名,大家努力的,发明个算法,以自己名字来命名的。
pagerank 基本思想
- 数量假设:一个页面越被其他页面链接,说明他越重要(ps:难怪好多技术博客的都互相链接)
- 质量假设:越是被高质量页面链接,说明该页面越重要(ps:最好能被大博主推荐一波,粉丝蹭蹭蹭往上涨)
pagerank 模型
pagerank 模型模拟的是一个用户在互联网上浏览到每个网页的概率。
下面来一个简单计算,更好的理解下:
pg(A) = pg(C)/1 + pg(B) /2
A网页的pagerank值由网页B和网页C的pagerank贡献而来,因为B网页有两个外链,假设等概率贡献,则贡献给A的值为自身的一半。
再看一个例子