google怎么做(3.搜索结果重排序)

中科院软件所 张俊林

TIMESTAMP:2006年5月19日

GOOGLE在用户初次检索结果基础上又利用链接关系进行了重排序,期望能够使得排序结果与用户查询更加相关,其算法如下:

(1) 首先根据用户查询得到初步检索结果,从初次检索结果里面选择前列K个页面构成重新排序的一个页面集合;在选择页面时候对于属于同一网站的多个页面,只保留分值最高的页面,其它页面忽略;

(2) 计算集合内页面的LOCAL SCORE,基本计算原则是如果一个页面被越多的集合内页面链接指向(INLINK),那么LOCAL SCORE越高;

(3) 将原先的相关分值和LOCAL SCORE进行线性插值计算最终的相关性得分:

NewScore(x)=(a+LocalScore(x)/MaxLS)(b+OldScore(x)/MaxOS)

其中,MASLS是最大LOCAL SCORE分值,MAXOS是最大的原先计算的相关分值,通过这两个值进行归一化,ab是常数用于调整两个分值的权重.

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页