IR
YY.Jiang
这个作者很懒,什么都没留下…
展开
-
信息检索评价指标NDCG、a-NDCG
PAMM中使用的检索多样性的评估方法为:。 在NDCG中,文档的相关度可以分为多个等级进行打分。 (1)CG(Cumulative Gain):表示前p个位置累计得到的效益,公式为:其中rel表示第i个文档的相关等级,如2表示非常相关,1表示相关,0表示无关,-1表示垃圾文件。 (2)DCG(Discounted Cumulative gain) 在原创 2017-12-02 20:51:54 · 15718 阅读 · 0 评论 -
Indri:安装及使用
Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发。安装下载。下载Indri并进入indri文件夹的顶层目录!!!修改configure文件权限。确认其中的configure文件的权限是否是rwx(可读可写可执行)。一般来是rw,需要改成rwx。终端输入chm原创 2017-12-14 21:45:54 · 3499 阅读 · 0 评论 -
最大边缘相关(Maximal Marginal Relevance,MMR)对文档重排序
采用MMR(Maximal Marginal Relevance)算法对文档diverse ranking。 从MMR的公式中可以看出,diverse ranking的实现是权衡Query与Document相关性和Document间的冗余性的结果。用MMR进行文档重定序的计算方法:1. 用常用IR方法取得前K个文档记Dr= IR(C, Q, K)2.原创 2017-11-27 20:31:00 · 3949 阅读 · 0 评论