最近要用Terrier平台作为医学文献检索项目的工具,自己也探索了一下,感觉中文资料甚少,Terrier也有好多特性有待自己发掘,索性将官方文档翻译出来,方便自己也方便别人,还没有全部弄完,几日更新一篇吧,水平有限差错肯定不少,见者指正吧。
文档官方地址:http://terrier.org/docs/v4.1/
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Terrier的介绍 | |
对于什么是Terrier平台以及它能做什么的概述。 | |
最新发布的Terrier平台有什么改变。 | |
| |
Terrier入门 | |
包括如何下载、安装和启动Terrier的信息,以及对Terrier所提供的应用的概述。 | |
Terrier主要组件的概述。. | |
| |
使用Terrier | |
对Terrier配置的简介。 | |
建立索引的向导, 以及如何按照自己的需求进行配置。 | |
检索功能的指南,涵盖了常用的检索方法, 比如TF-IDF, Okapi's BM25, 语言模型(Hiemstra 和 Ponte & Croft) 和概率加权模型 Divergence From Randomness (DFR), 以及查询扩展 (伪相关反馈)。 | |
用Terrier来“学习排名”(LTR) | 使用多项带有“学习排名”技术的检索功能来提高搜索效率的指南。 |
对Terrier支持的查询语言的描述。 | |
展示如何用Terrier内建的评价包来对实验结果做评价。 | |
对Terrier的实时索引结构的介绍。 | |
Terrier的Desktop Search应用的使用指南。 | |
Terrier的Web-based应用的使用指南。 | |
website search 应用的指南, 介绍了Terrier的实时爬取、索引和检索的功能。 | |
一个在WT2G和Blogs06数据集上创建索引并生成TREC的一个run的实例。 | |
运用Hadoop集群来配置Terrier的指南。 | |
Terrier里的Hadoop MapReduce索引器的使用指南。 | |
Terrier的特性列表 | 更多Terrier所支持的特性以及他们的配置。 |
| |
Terrier进阶& 一些高级话题 | |
Terrier开发 | 介绍运用Terrier开发应用。 |
索引的进阶指南,包括各个类在建索引过程中扮演的角色。 | |
检索的进阶指南,如何将不同的检索功能集成到Terrier以及如何运用Terrier来获取各种关于术语和集合的统计量。 | |
介绍字节级的压缩方案来缩小Terrier索引结构的尺寸。 | |
介绍Terrier支持的能对非英语语言文档进行索引与检索的功能。 | |
DFR的描述 | 对Terrier实现的Divergence From Randomness(DFR)框架的描述。 |
Terrier中每个类的API文档。 | |
在未来版本中即将推出的特性。 | |
| |
其他信息 | |
Terrier论坛支持Terrier的开发者与用户在上面讨论软件、问问题、发送补丁和分享技巧。 | |
各种知名语料库的配置与使用技巧,注意事项。 | |
如果运用Terrier做研究,请注明引用。 | |
Terrier联系方式。 |