第10章 PageRank :Google的民主表决式网页排名技术
搜索引擎的网页排序:网页的质量信息;查询与网页的相关性信息
1. PageRank算法的原理
核心思想:如果一个网页被很多其他网页所链接,说明他受到普遍的承认和信赖,那么它的排名就高(网页排名高的网站贡献的链接权重大)
解决先有鸡蛋先有鸡的问题:二维矩阵相乘,并用迭代的方法解决了这个问题。即先假定所有的网页的排名是相同的,根据这个初始值算出各个网页的第一次迭代排名,然后再根据第二次的排名算出第三次。。。
利用稀疏矩阵计算的技巧,大大简化了计算量,并实现了网页排名算法
发明并行计算工作MapReduce,