![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Information Retrieval
凡眼观世界
这个作者很懒,什么都没留下…
展开
-
概率检索模型—BM25和BM25F实现文本相关度打分
目标需求给定一个搜索词,从已有文本库中找出最相关的文本BM25模型理论知识这是一个文本检索(Text Retrieve)问题,常用策略是据搜索词对文本库中的文本排序,并选取最相关的返回。下面使用简单易用的BM25算法来实现相似度打分。Q:Query 输入的查询语句q:query 查询语句的词D:Document 文本库中的所有文本d:document 文本库中某一篇文本BM25...原创 2020-03-16 16:51:04 · 2049 阅读 · 0 评论 -
信息检索—布尔模型(Boolean )和向量空间模型(VSM)
布尔模型(Boolean Model)要从文档集合D={d1,d2,…,dn}中检索出: 包含"北京妹纸",或者"杭州妹纸, "但不包括"日本妹纸"的文档。假设D = {“北京的妹纸豪爽”,“北京是中国首都,而东京不是日本首都,一个妹纸说”,“北京和杭州都是旅游名城”,“杭州的妹纸温婉”}将查询语句表示为布尔表达式:Q = 妹纸 AND (北京 OR 杭州) NOT 日本将布尔表达式Q转...原创 2020-03-16 15:49:13 · 5001 阅读 · 0 评论