大家上网最常用的一个工具是谷歌搜索,比如搜索“笑话”,会返回与笑话相关的网页链接结果,供你选择。问题来了,搜索是如何进行的,机器怎么去尽力找到跟你搜索信息相关的网页的呢?
Page-Rank
谷歌公司对网页进行重要性评估,并且基于此计算网页等级并给出搜索结果。
网页重要性评估
Google根据链接来衡量网页重要性,并做了两个重要假设:
1. 数量假设:在Web图模型中,如果一个页面节点接收到的其他网页指向的入链数量越多,那么这个页面越重要。
2. 质量假设:指向页面A的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重。所以越是质量高的页面指向页面A,则页面A越重要。
假设有四个网页如下,箭头表示外链:
构造链接概率矩阵 S=⎡⎣⎢⎢⎢⎢01/31/31/3001/21/2000101