Query Recommendation using Query Log in Search Engines

原创 2012年03月31日 20:02:40

  1. 背景:

论文作者是Ricardo baeza-Yates,此人是率先研究关键词推荐的人物之一。当时还在 University of Chile 的Web Research 中心,后来去了yahoo研究院,领导在 Barcelona, Spain and Santiago的yahoo研究院。Ricardo baeza的主页:http://www.dcc.uchile.cl/~rbaeza/

2 论文思想:

这篇论文的思想其实很简单、很基础。用户搜索了一个Query,然后点击结果中的链接,那么就可以构成一个Query到URL的向量。这样就可以计算Query之间的相关性。


3 相似性:

先用term-weight的向量来表示每个Query。

把Query对应的URL的单词作为term。q[i]表示词典中的一个单词,这个q[i]就是向量中的一个维度。这个和BM25算法(Query-Doc相关性计算)中的语素是不一样的,那里是query的分词。

然后直接用cosin函数作为相似性的衡量标准。


4 实验数据:

使用Todocl 搜索引擎15天的log。22190个点击;18527个URL。这里每个Query的点击数量相当少。

聚类方法:k-means

5 评测

实验室的人做review评测。

不同的方法;召回10个结果的准确率都很低,这可能和日志数据比较少有关。

在召回2-5个的时候,准确率差异很大。Support算法最好,有明显的效果。


相关论文:

《The query-flow graph: model and applications》

 Random Walks on the Click Graph


lucene搜索源码过程简析

转载请务必注明,原创地址,谢谢配合!  http://qindongliang1922.iteye.com/blog/2013702  今天来谈下有关在Lucene中,如何完成一个搜索的过程,...
  • ccit0519
  • ccit0519
  • 2014年02月11日 14:17
  • 1151

XMPP-0055搜索用户协议

请求搜索: openfire返回:
  • dangfm
  • dangfm
  • 2014年07月01日 14:39
  • 2173

Solr 查询参数

solr常用查询参数 q:查询关键词。支持 AND,OR ,*,?。支持多字段查询,模糊匹配。 fq:filter query,过虑查询。 sort:排序规则。默认按score排序。 start, r...
  • wbcg111
  • wbcg111
  • 2015年08月22日 20:38
  • 798

如何在不同信息提供者之间复制QUERY

How To Copy Query With Different Infoproviders or Different Infoobjects 由 Loed Despuig 于 2015...
  • Bruce_yin
  • Bruce_yin
  • 2016年07月18日 18:25
  • 386

6、Power Query-SQL与PQ技术的强强联合

数据来源之ODBC——SQL与PQ技术的强强联合 比如有的功能SQL比较简单,又比如有的功能用Power Query更加简单,我们可以用他们联合的方式增强工作效率。 本节要求: 求出姓名为两个字的人,...
  • zhongguomao
  • zhongguomao
  • 2016年12月29日 09:51
  • 2802

37、Power Query-不使用IF嵌套进行匹配

本节要点:Power Query-不使用IF嵌套进行匹配(突破IF语句嵌套写法) 标题可能很笼统,话不多说,直接看案例。 左表是学生成绩表,右边是成绩范围对应的等级,目的是匹配到学生成绩的等级...
  • zhongguomao
  • zhongguomao
  • 2017年01月16日 10:31
  • 1929

Elasticsearch的查询器query与过滤器filter的区别

elasticsearch的查询器query与过滤器filter的区别
  • matl1990
  • matl1990
  • 2016年09月07日 19:30
  • 1077

短文本/Query分类算法特征选择

短文本/Query分类算法特征选择    最近工作中有一个project需要对query进行行业分类(label较多,大于1k),在以往的长文本中,一般使用文本的词向量结合tf-idf作为权重,分类...
  • rosenor1
  • rosenor1
  • 2016年09月16日 10:12
  • 1025

query查询&分页

转载自:http://blog.csdn.net/xiaojimanman/article/details/42969443 在Lucene索引的搜索过程中,构建Query对象是一个十分重要的过程。...
  • zero__007
  • zero__007
  • 2015年04月08日 10:28
  • 1539

如何预测用户query意图

转载原文:http://news.cnblogs.com/n/87820/ 有一个朋友问,一个用户搜索一个query是“百度”,怎么知道用户真正是想找什么呢。   我回答说,分...
  • chuntian_feng
  • chuntian_feng
  • 2016年07月10日 15:23
  • 1225
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Query Recommendation using Query Log in Search Engines
举报原因:
原因补充:

(最多只允许输入30个字)