PageRank原理

PageRank是谷歌用于评估网页重要性的算法,主要基于链接的数量和质量。网页的PR值从0到10,高分表示更重要。算法初始阶段为每个网页分配相同权重,然后通过链接权重迭代更新。PageRank的修正公式描述了网页得分的计算过程,通过矩阵运算求解。了解并实现PageRank有助于理解网页排名的逻辑。
摘要由CSDN通过智能技术生成

真尴尬····参加Wind的宣讲会,笔试第一个简答就是描述PageRank,我一脸懵逼·····我只知道这是谷歌用来对网页进行排序的算法,好像有个什么权重系数,什么什么来着???回来赶紧补上。这么重要经典的算法我都不知道,真是枉为立志搞算法的人了【哭唧唧】

进入正题

PageRank的原理是,通过计算链接到一个网页的数量及质量来对该网页的重要程度有一个估计。它所依赖的假设是越重要的网页通常会有更多的网页链接到他。——-from wiki
图片来自Wiki
PageRank的结果从0到10,10级为满分。PR值越高说明网页越重要/受欢迎。例如PR值为1的网站不太重要,而PR值为7~10的网站可以说是非常重要了。一般到4,就能说是一个不错的网站。Google将自身PR值定为10(调皮).
两个假设:

  • 数量假设:指向它的链接越多,那么说明这个网页越重要
  • 质量假设:指向它的链接越重要(用权重衡量),说明这个网页越重要。

    算法过程如下:

    • 初始阶段,网页通过链接构建web图,为每一个网页分配一个初始的权值。
    • 权值更新:每个网页,为每个出链设置当前权值的平均值大小的权重;对入链的权值求和&#
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值