网页块粒度分析算法

该博客探讨了网页块级别(Blocklevel)的链接分析算法,利用VIPS网页分割将网页划分为不同区域,并建立链接矩阵。在这一过程中,计算了pagetoblock和blocktopage的PageRank(W§)及BlockRank(W(b)),用于评估网页块的重要性。这种方法有助于提升链接分析的精度和相关性。
摘要由CSDN通过智能技术生成

在一个页面中,往往含有多个指向其他页面的链接,这些链接中只有一部分是指向主题相关网页的,或根据网页的链接锚文本表明其具有较高重要性。
在网页块级别(Block level)进行链接分析的算法的基本思想是通过VIPS网页分割算法将网页分为不同的网页块(page block),然后对这些网页块建立page to block和block to page的链接矩阵,分别记为Z和X。于是,在page to page图上的网页块级别的PageRank为 W§=X×Z;在block to block图上的BlockRank为 W(b)=Z×X。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值