搜索下一站：个性化搜索基本方法和简单实验_缩放个性化网络搜索实现-CSDN博客

本文探讨个性化搜索的原理，指出其通过用户模型分析进行搜索结果加权，以提升用户搜索体验。介绍了基于规则过滤、内容过滤和协同过滤的实现方式，并分享了腾讯soso在该领域的实验，包括基于好友关系链的协同过滤方法，以及分类算法构建的用户和文档模型，证实个性化搜索的有效性。

腾讯soso 文/王亮

所谓的个性化搜索，就是将用户输入的关键字和该用户的个人偏好联系起来进行查询，据此猜测该用户可能想要得到的信息，从而将该用户最可能需要的信息显示在最前面。

个性化搜索研究早在上世纪九十年末就已有之，相关的方法和研究已经非常多，但商业化的大规模应用尚未出现。其根本原因在于很少有用户愿意直接或间接提供个人信息，像目前很多实验系统都是采集IP的点击记录、cookie等信息构建用户模型，这样的模型显然也很难精确。

但随着社区网络的快速发展，以用户为核心的UGC内容逐步成为互联网内容的主流，个性化搜索实现的主要障碍正在逐步消失。当前“Facebook+Bing”Vs “Twitter+Google” 正在如火如荼的进行中，个性化很可能再次改变搜索界的版图。

基本需求

个性化搜索的需求也比较明确，好比前一段时间，“章鱼”属于热门检索词，一些喜爱运动的童靴想搜索到“章鱼哥”和世界杯的故事，而一些生活化的mm，可能主要是需要如何做章鱼小丸子。但前一段“章鱼哥”仙去的那几天，大部分搜索引擎给出“章鱼”的结果，靠前面的基本都是关于体育的。这正是当前搜索引擎排序的基本思路，满足“大多数人”的需要。

但目前社会正逐步趋向于“碎片化”，这种“大多数人”比例以前可能是80%，现在或未来可能只占30%。而从用户的角度来看，大部分用户都是“懒惰”的，一般只输入1到3个词，而且不懂not/and/or，很难充分表达自己的信息需求，但现在的搜索只提供的千人一面的结果，不考虑个体的差异性，无关网页就很多。

从满足“大多数人”的需求逐步转向为每个人“量身定制”搜索，以提高用户的搜索体验，这正是个性化搜索要做的。

个性化搜索基本方法

个性化搜索的“实质”其实就是对用户的检索词进行了“自动”的“扩展”。这种“扩展”基于对不同用户自身信息的分析。

个性化搜索流程基本都分为三步：

(1) 根据用户检索，获得原有的搜系统的检索结果集。