楼楼刚才想了一个特别骚情的标题,叫PageRank算法和HITS算法的“前世今生”,特别像之前写头条号的套路,然后就想起来去年6月份自己有在经营一个技术型的头条号,后来因为做不到一天一篇的更新频率被我弃坑了,现在手机号换了,登陆不了,去主页看了看之前写的文章,竟然被一直这么努力的自己感动到了。:)
PageRank算法和HITS算法都属于比较著名的链接链接分析方法,作为经典方法,由此也衍生出一些列相关方法,从下图就可以看出这两种方法的前世今生。
随机游走模型:
随机游走模型就和它字面意思所表述的那样,用户的浏览在网页之间进行跳转,假设网页包含k个出链, 用户从当前页面跳转到这k个页面的概率是相等的。用户不断重复上述过程,在相互有链接指向的页面之间跳转,如果对于某个页面所包含的所有链接,用户都没有兴趣继续浏览, 则可能会在浏览器中输入另一个网址,直到到达该网页,这种行为被称为“远程跳转” 。而随机游走模型就是一个对直接跳转和远程跳转两种用户浏览行为进行抽象的概念模型。
实例