google怎么做(3.搜索结果重排序)

原创 2006年05月19日 17:36:00

中科院软件所 张俊林

 TIMESTAMP:2006年5月19日

GOOGLE在用户初次检索结果基础上又利用链接关系进行了重排序,期望能够使得排序结果与用户查询更加相关,其算法如下:

(1)   首先根据用户查询得到初步检索结果,从初次检索结果里面选择前列K个页面构成重新排序的一个页面集合;在选择页面时候对于属于同一网站的多个页面,只保留分值最高的页面,其它页面忽略;

(2)   计算集合内页面的LOCAL SCORE,基本计算原则是如果一个页面被越多的集合内页面链接指向(INLINK),那么LOCAL SCORE越高;

(3)   将原先的相关分值和LOCAL SCORE进行线性插值计算最终的相关性得分:

 

  NewScore(x)=(a+LocalScore(x)/MaxLS)(b+OldScore(x)/MaxOS)

其中,MASLS是最大LOCAL SCORE分值,MAXOS是最大的原先计算的相关分值,通过这两个值进行归一化,ab是常数用于调整两个分值的权重.

抓取 google 搜索结果

直接访问www.google显然是无法访问的,附上两个地址: http://209.85.225.23/ http://173.194.14.53/ 这两个地址搜索的后缀是 newwindow=...
  • zzukun
  • zzukun
  • 2015年05月16日 11:06
  • 1562

编写Python脚本来获取Google搜索结果的示例

前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童鞋不要再走弯路。 1. 搜索引擎的选取   选择...
  • junli_chen
  • junli_chen
  • 2016年08月18日 19:12
  • 679

Lucene实战(三)多Field搜索,并且对搜索结果进行过滤和[自定义]排序

前言 如果你是一个
  • mthhk008
  • mthhk008
  • 2014年05月16日 15:10
  • 2733

【腾讯云搜分享】如何通过干预搜索结果排序,实现产品运营的策略和目的

搜索的目的主要是为了提升产品的转化,因此搜索结果的排序除了考虑文本相关性外,能够满足产品运营策略是非常必要的,今天就主要介绍如何通过排序实现数据运营的目的...
  • qq_25138881
  • qq_25138881
  • 2015年12月10日 18:56
  • 636

sql语句去重,以及重排序

今天在建表并往表里添加数据时,不小心将数据重复上传了,也没有按顺序如下图: ,看着极度不爽,也就想着可不可以修改一下表,删除掉重复的数据,且根据字段node_id 从小到大顺序排列,于是首先...
  • tangjue18246068217
  • tangjue18246068217
  • 2016年04月29日 16:28
  • 2770

Google搜索解析规则-更准确的使用谷歌搜索引擎获取到自己想要的内容

如果票选近二十年最伟大的发明,我相信搜索引擎肯定会占据一个不容小觑的位置,它不单是一项发明,更是一项成就,最大程度消灭了信息的不平等。既然人人都可以接触到海量的信息,那么衡量信息财富多寡就只剩下技巧这...
  • xhhayward
  • xhhayward
  • 2016年12月16日 15:50
  • 1875

影响搜索结果排序之:六个维度

百度的排序算法维度: 用户输入关键词进行检索,百度搜索引擎在排序环节要做两方面的事情,第一是把相关的网页从索引库中提取出来,第二是把提取出来的网页按照不同维度的得分进行综合排序。“不同维度”包括...
  • helihongzhizhuo
  • helihongzhizhuo
  • 2015年09月02日 14:49
  • 647

让你的的搜索结果不一样,关于丰富网页摘要,微数据标记的一些分享

我们通过微数据标记,对特定内容结构化数据,这样可帮助 Google 了解我们网站上的内容,它可以用来在搜索结果中显示丰富网页摘要。 搜索结果的显示内容更丰富,与别人不同,帮助你提高点击。 今天边看...
  • wangji5850
  • wangji5850
  • 2016年03月29日 13:12
  • 674

Elasticsearch过滤与聚合的先后顺序java实现

Elasticsearch的聚合结果是先过滤或者搜索后聚合,那么如果我们想要先聚合,然后对结果进行再一次的过滤或者搜索应该如何实现呢,在此给出简单的java实现demo...
  • molong1208
  • molong1208
  • 2016年01月26日 21:10
  • 24288

突破限制爬取网页数据 googlesholar为例【转】

突破限制爬取网页数据 googlesholar为例【转】 1、为什么要爬取google scholar数据      Google Scholar上论文信息较为丰富,可以对应中英文搜索,结果较...
  • zhengalen
  • zhengalen
  • 2016年05月31日 19:48
  • 1510
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:google怎么做(3.搜索结果重排序)
举报原因:
原因补充:

(最多只允许输入30个字)