《数学之美(第一版)》笔记 —— 第10章

第10章 PageRank——Google的民主表决式网页排名技术

  • 搜索结果的排名取决于两组信息:关于网页的质量信息,和这个查询与每个网页的相关性信息
  • PageRank核心思想:在互联网上,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。(解决网页质量的问题)
  • PageRank的计算方式
    • 计算搜索结果的网页排名过程会用到网页本身的排名。
    • 使用一个二维矩阵相乘来迭代解决:首先假定所有网页的排名是相同的,并且根据这个初值,算出各个网页的第一次迭代排名,然后再根据第一次迭代排名算出第二次排名。理论上证明不论初始值如何选取,这种算法都保证了网页排名的估计值能收敛到排名的真实值。
    • 由于矩阵非常大,所以使用稀疏矩阵计算的技巧来简化计算量。
    • 使用MapReduce并行计算工具来加速网页更新的周期。

在这里插入图片描述

  • 补充
    • 稀疏矩阵的存储方式:
      • https://www.cnblogs.com/xbinworld/p/4273506.html
      • https://zhuanlan.zhihu.com/p/37525925
    • 稀疏矩阵的计算方式:
      • 基于CRS:https://xupsh.github.io/pp4fpgas-cn/06-Sparse-Matrix-Vector-Multiplication.html
      • LeetCode:https://www.cnblogs.com/grandyang/p/5282959.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值