IR
萌甘薯
这个作者很懒,什么都没留下…
展开
-
隐语义索引(LSI):词项与文档降维后的向量表示
隐语义索引(LSI):词项与文档降维后的向量表示给定 M×NM\times NM×N 的词项文档矩阵 CCC,对其进行奇异值分解并把 Σ\SigmaΣ 中对角线上 r−kr-kr−k 个最小奇异值置为 000 后得到了在F-范数意义下最优的1秩为kkk的低秩逼近CkC_{k}Ck:Ck=UΣkVTC_{k}=U\Sigma _{k}V^{T}Ck=UΣkVT把后 kkk 位奇异值...原创 2019-06-15 11:18:57 · 933 阅读 · 0 评论 -
信息检索导论 第十七章十八章知识点
层次聚类层次聚类(hierarchical clustering或hierarchic clustering)会输出一个具有层次结构的簇集合,可以是自顶向下或自底向上的一个过程。自底向上(HAC)的算法一开始将每篇文档都看成是一个簇,然后不断地对簇进行两两合并(或称凝聚(agglomerate)),直到所有文档都聚成 一类为止。而自顶向下的方法则首先将所有文档看成一个簇,然后不断利用某种方法对簇...翻译 2019-08-15 13:40:05 · 857 阅读 · 0 评论