pagerank学习

本文介绍了Google的PageRank算法,包括其基本原理、计算过程和在大数据平台上的性能基准测试。文章详细讲解了数据存储的几种方式,如邻接表、三元组(COO)、压缩稀疏行(CSR)和压缩稀疏列(CSC),并探讨了算法公式中的阻尼系数和rank向量更新规则。
摘要由CSDN通过智能技术生成

一、算法简介

       佩奇排名(PageRank),又称网页排名、谷歌左侧排名、PR,是Google公司所使用的对其搜索引擎搜索结果中的网页进行排名的一种算法。 佩奇排名本质上是一种以网页之间的超链接个数和质量作为主要因素粗略地分析网页的重要性的算法。
      算法计算过程如下所示,数学原理比较简单。简单来说就是通过节点的所有入度来更新节点。

二、Benchmark

PageRankBenchmark由MIT开发的基准套件,以此评估软硬件运行大数据应用的性能。Benchmark中包含4个kernel,

  • kernel0产生数据
  • kernel1对数据对边进行排序
  • kernel2利用kernel的结果构建sparse martix并计算入度和出度
  • kernel3测试Pagerank。
    在这里插入图片描述
三、数据的存储——sparse Martix

1、Adjacency list(邻接表)
      

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值