![](https://img-blog.csdnimg.cn/a7779127c4cd47b0b9b615fb361cd773.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
信息检索与数据挖掘
文章平均质量分 94
信息检索与数据挖掘
啦啦右一
好好学习,身心健康~o(〃^▽^〃)o
展开
-
信息检索与数据挖掘 | (十二)聚类
聚类是一种无监督学习,样本没有标签,将一群样本划分到一个类中,使得:最大化类间距,最小化类内。原创 2024-01-25 11:30:00 · 1858 阅读 · 0 评论 -
信息检索与数据挖掘 | (十一)深度学习
主体思想:先进行特征转化然后再进行分类原创 2024-01-25 09:15:00 · 1598 阅读 · 0 评论 -
信息检索与数据挖掘 | (十)线性回归与逻辑回归
使用loss function L来评估函数的好坏。从而我们要选择使L最小的模型参数w,b。原创 2024-01-24 09:45:00 · 953 阅读 · 0 评论 -
信息检索与数据挖掘 | (九)Link Analysis(链接分析)
Power Iteration的基本思想是通过不断迭代更新网页的权重值,直到收敛。原创 2024-01-24 08:15:00 · 915 阅读 · 0 评论 -
信息检索与数据挖掘 | (八)语言建模的IR
传统的语言生成模型可以用于识别或生成字符串。如果每个自动机的节点都有一个生成不同此项概率分布,便可以得到一个语言模型。原创 2024-01-23 09:15:00 · 1075 阅读 · 0 评论 -
信息检索与数据挖掘 | (七)概率检索模型
概率排序通过将输入映射到输出的概率,并根据概率大小对输出进行排序,从而提供了一种基于统计和概率模型的排序方法。原创 2024-01-23 08:15:00 · 1031 阅读 · 0 评论 -
信息检索与数据挖掘 |(一)介绍
信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。原创 2023-09-07 15:38:28 · 1126 阅读 · 0 评论 -
信息检索与数据挖掘 | (二)布尔检索与倒排索引
对于词项个数和文档规模很大的情况,构造出的关联矩阵是高度稀疏的。这时,只记录原始矩阵中1的位置的表示方法比词项-文档关联矩阵更好。因此,引出了倒排索引。原创 2023-09-20 23:07:28 · 1121 阅读 · 0 评论 -
信息检索与数据挖掘 | 【实验】倒排索引与布尔查询
在tweets数据集上构建inverted index。Boolean Retrieval Model:分别实现and,or,not,and not四种查询对应的函数,不需要做查询优化。对于tweets与queries使用相同的预处理。原创 2023-09-26 14:54:12 · 314 阅读 · 0 评论 -
信息检索与数据挖掘 | (三)模糊检索
大爷想查找一个姑娘叫马*梅,但他确实不记得了,只能采用模糊查询。原创 2023-09-27 15:20:59 · 313 阅读 · 0 评论 -
信息检索与数据挖掘|(四)索引构建
如何建立倒排索引,我们称这个过程为索引构建。原创 2023-10-17 11:19:54 · 1502 阅读 · 0 评论 -
信息检索与数据挖掘 | (五)文档评分、词项权重计算及向量空间模型
我们需要一种方法分配一个分数,如果查询项不出现在文档,分数应该是0,更频繁的查询项的文档,分数越高。在文档集规模很大的情况下,满足布尔查询的结果文档数量可能非常多,往往会大大超过用户能够浏览的文档数目。因此对搜索引擎来说,对文档进行非常重要。原创 2023-10-22 20:59:34 · 1368 阅读 · 0 评论 -
信息检索与数据挖掘 | 【实验】排名检索模型
在文档集规模很大的情况下,满足布尔查询的结果文档数量可能非常多,往往会大大超过用户能够浏览的文档数目。因此对搜索引擎来说,对文档进行评分和排序非常重要原创 2023-10-25 18:04:09 · 1874 阅读 · 0 评论 -
信息检索与数据挖掘 | (六)信息检索度量指标
IR evaluation转载 2023-11-07 10:44:49 · 297 阅读 · 0 评论 -
信息检索与数据挖掘 | 【实验】检索评价指标MAP、MRR、NDCG
MAP、MRR、NDCG原创 2023-11-14 21:15:00 · 2317 阅读 · 0 评论