图机器学习——3.2 PageRank 算法问题改进与延伸

最新推荐文章于 2024-10-13 09:54:32 发布

Kanny广小隶

最新推荐文章于 2024-10-13 09:54:32 发布

阅读量2.4k

点赞数 1

分类专栏：图机器学习文章标签：机器学习人工智能图模型 PageRank 重要性

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41929524/article/details/121736652

版权

本文探讨了PageRank算法在实践中遇到的死节点和局部陷阱问题，并介绍了通过添加传送机制进行改进的方法。特别关注了在推荐系统中如何利用PersonalizedPageRank实现非均匀随机游走，以提升商品间的相似度计算。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. PageRank 算法问题与改进

PageRank 算法在实际迭代过程中会遇到两个问题：

死节点（dead ends）

产生此问题的原因是有些节点没有向外的连接，如下图的 $b$ ，那么就会导致最终重要性得分会变成0.

出现此问题后不满足列和为1的假设，最终求解会出现问题。

局部陷阱（spider traps）

这种问题是由于所有的往外的连接都在一个小的组内，最终这个“陷阱”会吸收掉所有的重要性，如下图的 $b$ 所示。

这个问题在数学本身的求解上并不是问题，但出现局部陷阱后得到的并不是我们所期望的重要性得分。

解决上面两个问题的方法比较简单，在出现问题的节点上加入传送（teleports）机制：

以 $\beta$ 的概率按照已知的连接情况进行游走；
以 $1-\beta$ 的概率随机跳到任意一个节点上.

若添加的是均匀传送且在出问题的节点上 $\beta=0$ ，则转移矩阵可变为：

而在实际的操作中，我们可以在每一次转移时都进行随机传送的操作，则节点 $j$ 重要性得分计算方程变为：

$r_{j}=\sum_{i \rightarrow j} \beta \frac{r_{i}}{d_{i}}+(1-\beta) \frac{1}{N}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。