云计算
文章平均质量分 89
iteye_12136
这个作者很懒,什么都没留下…
展开
-
浅析PageRank(概念篇)
PageRank是Google搜索算法中最为基础而核心的一种,通过将网络看做一个整体、网页间链接即投票等思想构建出了最初的排名机制,并使得Google击败当时的Yahoo搜索,成就了今天的地位。PageRank的实现包含了很多数学方法应用,要真正理解还是有难度的,这篇博客中,我只基于自己的理解写出一些比较浅显的概念以及分析。 首先来说一下PR出现的原因吧~自上...原创 2011-12-17 21:40:13 · 714 阅读 · 0 评论 -
浅析PageRank(公式篇1)
说实话,这篇博客写的真的很纠结~PageRank作为一个如此成功而强大的排序算法,内部现非常的复杂,在用矩阵进行数学建模后,又用到了迭代的思想使计算值趋于稳定,其中还涉及到了衰退因子、模型收敛等问题,我只能就着自己少量的线性代数知识对其进行简单的分析,梳理出我考虑PR实现思路,这里我的说明只是理论上的,所有实验室设备的操作(比如Octave中编制脚本,设计稀疏矩阵等,下文中例举的O...原创 2011-12-18 15:29:22 · 603 阅读 · 0 评论 -
浅析PageRank(公式篇2)
上公式~~~PageRank最开始一个版本的公式: 最基本的概念这里不再赘述,对公示稍加解释:页面A的PR是由页面B、C、D一起贡献的,每个页面贡献给A的大小由各自链出数目决定,如果B有五个链出,PR(B)=10,那么就有2的值给A。q是阻尼因子,指代浏览者沿着当前链接继续阅读的可能性,每个页面都有一个最小值1-q,PR中q=0.85。 接下来...原创 2011-12-22 21:00:20 · 523 阅读 · 0 评论