《The query-flow graph: model and applications》

  1. Query graphs:

Baeza-Yates 指出有5种不同类型的图。在所有的方法中,结点是query;边被引入两个结点间。

word graph:两个query有共同的term

session graph:同一个session内的query。

url conver graph:用户点击了搜索结果中的相同的url。

url link graph:两个被点击的url直接有边

link graph:如果两个url有共同的term。


         2 Query Segmentation.

                    这里的query分割,不是对query的分词,而是对用户联系输入多个query,按照意图分割为多个session。

         3.基本概念:

Query log:一个query log,必须包含的,user id(cookie),time,query,click url,browser,refer url

Session:特定用户在具体时间限制内的Query

构建THE QUERY-FLOW GRAPH(查询流图)

根据Query-Query的转义概率统计得到 query flow graph。由于某些query之间无法统计,因此另外一种方法是构造模型来计算query pair之间的相关性。模型特征包括3种特征:文本特征,session特征,时间相关的特征。

计算方法:

变为TSP问题求解。

阅读更多
个人分类: 互联网
想对作者说点什么? 我来说一句

graph theory with applications 中文版

2009年03月20日 7.96MB 下载

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭