信息检索模型

信息检索模型

布尔模型

image-20210620230601126

优点

image-20210620230717312

缺点

image-20210620230748739

向量空间模型

模型描述

image-20210620230856967

image-20210620230910313

索引项

image-20210620231018784

image-20210620231039579

出现次数

image-20210620231132517

TF-IDF

image-20210620231412704

概率模型

image-20210622202858266

二值独立模型(BIM)

  • 二值(等价于布尔值):文档和查询都表示为此项出现与否的不二向量
  • 词项在文档中的出现是相互独立的

利用概率模型来估计每篇文档和查询之间的相关性概率,然后对结果进行降序排列

image-20210622203239671

image-20210622203534930

排序函数

image-20210622203659380

词项的独立性

image-20210622204058963

image-20210622204329436

推导简化

image-20210622204455025

image-20210622204540073

image-20210622204637291

image-20210622211342181

u t u_t ut的估计

image-20210622211825413

p t p_t pt的估计

image-20210622212128023

向量空间模型与概率模型的差别

image-20210622212242146

Okapi BM25:非二值的概率模型

image-20210622212409459

image-20210622212550048

image-20210622212917957

image-20210622213653992

image-20210622213719928

语言模型

语言模型在信息检索中的应用

image-20210622214546726

image-20210622225543956

image-20210622230132657

image-20210622230946235

image-20210622231037993

image-20210622231253342

image-20210622231346711

image-20210622231450257

image-20210622231504719

最大似然估计的问题

image-20210622231948032

image-20210622232025872

image-20210622232128789

image-20210622232254264

语言模型与向量空间模型

image-20210622232334782

image-20210622232425703

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值