Agglomerative clustering of a search engine query log (论文笔记)

最新推荐文章于 2024-04-24 21:39:11 发布

VIP文章 shuishiman

最新推荐文章于 2024-04-24 21:39:11 发布

阅读量1.9k

点赞数

分类专栏：数据挖掘文章标签：数据挖掘 query聚类搜索引擎二部图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shuishiman/article/details/23214603

版权

原论文下载地址：http://www.cs.cornell.edu/courses/cs6784/2010sp/lecture/24-BeefermanBerger00.pdf

最近看了一下Agglomerative clustering of a search engine query log这篇论文，有一定的收货，并做一些笔记，方便以后复习使用.

这篇论文主要讲述了从搜索引擎的点击数据中对query和url进行聚类。在比较成熟的文本聚类中，一般使用的是用一个高纬的term向量来表述一个文档，然后再使用cos、KL，皮尔逊等距离计算来公式来计算doc之间的相似度。这篇论文中讲述的算法跟以前的算法不同之处是不依赖query和url的内容，而直接使用用户的点击信息来进行聚类。

url聚类：

之前使用url的内容进行聚类，使用文本的内容来进行聚类有如下几点的不足：

1. 内容较少的页面，如：一些包含大量图片的网站等

2. 有些需要登录的页面

3. 页面内容动态变化

对于如上几种情况，本论文介绍的不考虑内容的算法将有优势。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Agglomerative clustering of a search engine query log (论文笔记)

最近看了一下Agglomerative clustering of a search engine query log这篇论文，有一定的shou
复制链接

扫一扫

专栏目录

shuishiman CSDN认证博客专家 CSDN认证企业博客

码龄16年

2: 原创

131万+: 周排名

177万+: 总排名

2万+: 访问

: 等级

267: 积分

8: 粉丝

2: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

分类专栏

最新评论

短文本/Query分类算法特征选择
rosenor1: 您好，我想问一下摘要扩展具体怎么扩展，如何获取query对应的摘要数据

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。