NLP学习—19.检索式对话系统中的rank评估指标、rank技术(Point-wise/Pair-wise/List-wise)以及RankNet、LambdaRank、LambdaMART

本文介绍了检索式对话系统中的Rank评估指标,包括MAP和NDCG,以及Point-wise, Pair-wise, List-wise三种Rank技术。重点讲解了RankNet、LambdaRank和LambdaMART的工作原理和优化目标,强调了这些技术在处理排序问题时对相关文档位置的重视和优化。此外,还提及了Context Free Grammar和CKY算法在自然语言处理中的作用。" 126706455,14265589,思维导图在当代工业设计中的应用,"['设计方法', '工业设计', '创新思维', '企业管理', '产品开发']
摘要由CSDN通过智能技术生成

引言

  在前面几部分我们学习了检索式对话系统的召回(recall),召回可以从海量数据中快速找到相似的Top K文本?一种是基于字符串的召回,比如:BM25+倒排索引;另一种是基于向量的召回,比如:HNSW、Annoy、SIF。对召回结果进行重新排序叫做Ranking。

一、rank 评估指标—MAP、NDCG

1.MAP

  MAP(Mean Average Precision):平均准确率是相关文档检索出后的准确率的平均值。 反映系统在全部相关文档的性能单值指标,检索出来的相关文档越靠前(rank 越高),MAP就可能越高。MAP:分子是第几个文档,分母是rank数,多个相加然后求平均
例如:假设有两个主题: 主题1有4个相关网页, 主题2有5个相关网页。 某系统对于主题1检索出4个相关网页,其rank分别为1, 2, 4, 7;对于主题2检索出3个相关网页,其rank分别为1,3,5。
M A P = ( 1 1 + 2 2 + 3 4 + 4 7 ) / 4 M A P = ( 1 1 + 2 3 + 3 5 + 4 ∞ + 5 ∞ ) / 5 MAP=(\frac{1}{1}+\frac{2}{2}+\frac{3}{4}+\frac{4}{7})/4\\MAP=(\frac{1}{1}+\frac{2}{3}+\frac{3}{5}+\frac{4}{∞}+\frac{5}{∞})/5 MAP=(11+22+43+74)/4MAP=(11+32+53+4+

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值