衡量搜索引擎的性能

      我们可以将WEB信息的搜索看作一个信息检索问题,即在由WEB网页组成的文档集中检索出与用户查询相关的文档.所以我们可以用衡量传统信息检索系统的性能参数一查全率(Recall)和查准率(Precision)–来衡量一个搜索引擎的性能。

       查全率是检索出的相关文档数和文档集中所有的相关文档数的比率.衡量的是检索系统(搜索引擎)的查全率;

       查准率是检索出的相关文挡数与检索出的文档总数的比率.衡最的是检索系统(控索引擎)的查准率.对于一个检索系统来讲.

        查全率和查准率不可能两全其美:查全率高时.查准率低;查准率高时,查全率低.所以常常用11种查全率下11种查准率的平均值(即11点平均查准率)来衡量一个检索系统的查准率.对于搜索引擎系统来讲,因为对于一个查询总能返回很多信息.所以查全率一般不成问题;加之.没有一个搜索引擎系统能够搜集到所有的WEB同页·查全率很难比较,所以衡量搜索引擎的性能时.查全率很少使用.目前的搜索引擎系统都非常关心查准率.即是否为用户提供了相关度报高的、高质量的导航信息.

       搜索引擎系统的其它衡量指标还有响应时间、支持峰值查询的能力、易用性、返回结果的有效性(是否为死链、过时信息)等等.

       影响一个搜索引擎系统的性能有很多因素.最主要的是信息搜集策略和检索模型,包括索引库的更新频率和策略、文档和查询的表示方法、评价文档和用户查询相关性的匹配策略,查询结果的排序方法和用户进行相关度反馈的机制.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值