主题:PageRank解释

本文深入解析PageRank算法的工作原理,包括其如何通过网页间的相互链接来评估网页的重要性和排名,以及它如何在Google搜索引擎中发挥关键作用。重点阐述了PageRank算法的发展历程、核心思想、计算方法以及它对互联网信息检索的巨大贡献。

转自:http://www.iteye.com/topic/95079

                               PageRank解释

      通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。
     此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。
     其实简单说就是民主表决。打个比方,假如我们要找李开复博士,有一百个人举手说自己是李开复。那么谁是真的呢?也许有好几个真的,但即使如此谁又是大家真正想找呢?:-) 如果大家都说在 Google 公司的那个是真的,那么他就是真的。
     在互联网上,如果一个网页被很多其它网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。这就是 Page Rank 的核心思想。 当然 Google 的 Page Rank 算法实际上要复杂得多。比如说,对来自不同网页的链接对待不同,本身网页排名高的链接更可靠,于是给这些链接予较大的权重。Page Rank 考虑了这个因素,可是现在问题又来了,计算搜索结果的网页排名过程中需要用到网页本身的排名,这不成了先有鸡还是先有蛋的问题了吗?
    Google 的两个创始人拉里•佩奇 (Larry Page )和谢尔盖•布林 (Sergey Brin) 把这个问题变成了一个二维矩阵相乘的问题,并且用迭代的方法解决了这个问题。他们先假定所有网页的排名是相同的,并且根据这个初始值,算出各个网页的第一次迭代排名,然后再根据第一次迭代排名算出第二次的排名。他们两人从理论上证明了不论初始值如何选取,这种算法都保证了网页排名的估计值能收敛到他们的真实值。值得一提的事,这种算法是完全没有任何人工干预的。
   
      理论问题解决了,又遇到实际问题。因为互联网上网页的数量是巨大的,上面提到的二维矩阵从理论上讲有网页数目平方之多个元素。如果我们假定有十亿个网页,那么这个矩阵 就有一百亿亿个元素。这样大的矩阵相乘,计算量是非常大的。拉里和谢尔盖两人利用稀疏矩阵计算的技巧,大大的简化了计算量,并实现了这个网页排名算法。今天 Google
的工程师把这个算法移植到并行的计算机中,进一步缩短了计算时间,使网页更新的周期比以前短了许多。我来 Google 后,拉里 (Larry) 在和我们几个新员工座谈时,讲起他当年和谢尔盖(Sergey) 是怎么想到网页排名算法的。他说:"当时我们觉得整个互联网就像一张大的图(Graph),每个网站就像一个节点,而每个网页的链接就像一个弧。我想,互联网可以用一个图或者矩阵描述,我也许可以用这个发现做个博士论文。" 他和谢尔盖就这样发明了 Page Rank 的算法。
      网页排名的高明之处在于它把整个互联网当作了一个整体对待。它无意识中符合了系统论的观点。相比之下,以前的信息检索大多把每一个网页当作独立的个体对待,很多人当初只注意了网页内容和查询语句的相关性,忽略了网页之间的关系。 
     今天,Google 搜索引擎比最初复杂、完善了许多。但是网页排名在 Google 所有算法中依然是至关重要的。在学术界, 这个算法被公认为是文献检索中最大的贡献之一,并且被很多大学引入了信息检索课程 (Information Retrieval) 的教程。

转载于:https://www.cnblogs.com/panweishadow/p/3340348.html

工地仓库管理系统(源码+数据库+毕业论文+开题+任务书+答辩ppt)java开发springboot框架javaweb,可做计算机毕业设计或课程设计 【功能需求】 本系统分为采购员、领料员、出库员、入库员、项目经理、管理员6个角色 采购员功能 采购员点击个人账户和输入密码登录系统,可以查看新材料申请详情以及进行材料采购操作,在采购页面输入具体的采购材料以及数量提交,可以在个人中心中修改个人资料。 领料员功能 领料员登录后,可以查看材料库存明细,进行领取申请,提交具体的申请单,以及提交新材料的领取申请,等待管理者的审核,还可以在个人中心进行个人资料信息的修改。 出库员功能 出库员登录后,可以查看材料库存明细,可以对领料员上传的领取申请进行审核处理,还可以提交材料处理申请至系统。 入库员功能 入库员登录后,可以查看材料库存明细,可以对采购的材料进行入库操作,还可以在个人中心中进行个人信息资料的修改。 项目经理功能 项目经理登录后,主要功能包括入库员、出库员、领料员、采购员用户的管理,进行材料分类,管理材料库存,查看领取申请,以及审核新材料申请,审核材料采购以及材料处理。 管理员功能 管理员登录后,主要功能包括项目经理、入库员、出库员、领料员、采购员用户的管理,进行材料分类,管理材料库存,查看领取申请,以及审核新材料申请,审核材料采购以及材料处理、系统日志等。 【环境需要】 1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的 2.IDE环境:IDEA,Eclipse,Myeclipse都可以 3.tomcat环境:Tomcat 7.x,8.x,9.x版本均可 4.数据库:MySql 5.7/8.0等版本均可 【购买须知】 本源码项目经过严格的调试,项目已确保无误,可直接用于课程实训或毕业设计提交。里面都有配套的运行环境软件,讲解视频,部署视频教程,一应俱全,可以自己按照教程导入运行。附有论文参考,使学习者能够快速掌握系统设计和实现的核心技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值