- 博客(3)
- 收藏
- 关注
原创 搜索引擎中几种语言模型的性能比较
[正文等待上传......]人工构建中文query,对人民日报语了进行测试,各种语言模型的效果对比结果如下: 插值 recall-precision 曲线图
2005-07-29 17:00:00 3114 2
翻译 Indri 动态文档索引技术
Indri中的动态文档索引技术戴维 译 摘要: Indri 动态文档索引的实现技术,支持在更新索引的同时处理用户在线查询请求。 文本搜索引擎曾被设计为针对固定的文档集合进行查询,对不少应用来说,这种机制工作得很好,然而对于诸于新闻,财经和桌面搜索而言,需要的是高效、经常性的更新索引。 以往支持动态文档集合的研究主要围绕增量索引方法,增量系统通过往已有的索引中追加大的文档集合来优化索引性
2005-07-29 09:52:00 7157 1
原创 Indri 开源搜索引擎
一直对Lemur有所熟悉,有感于国外大学在研究和实践上的并驾齐驱,特翻译并撰写Indri开源搜索引擎的相关文章,以供志趣相同者共同参考。 Indri是一个完整的开源搜索引擎,由卡耐基-梅隆大学Lemur项目组维护并持续开发。尽管只是Lemur信息获取工具系列的一部分,然而由于其使用最新的语言模型,高效的索引技术,完整的搜索引擎解决方案,不乏为搜索相关专业及爱好者研究之典范。 支
2005-07-29 09:35:00 7794
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人