IR evaluation
文章平均质量分 82
Tingella
这个作者很懒,什么都没留下…
展开
-
IR Evaluation Matrics
IR evalu信息检索评价是对信息检索系统性能(主要满足用户信息需求的能力)进行评估的活动。通过评估可以评价不同技术的优劣,不同因素对系统的影响,从而促进本领域研究水平的不断提高。信息检索系统的目标是较少消耗情况下尽快、全面返回准确的结果。IR的评价指标,通常分为三个方面:(1)效率(Efficiency)—可以采用通常的评价方法:时间开销、空间开销、响应速度。(2)转载 2014-09-05 13:39:50 · 729 阅读 · 0 评论 -
MMSEG分词算法
关于MMSEG分词算法MMSEG是中文分词中一个常见的、基于词典的分词算法(作者主页:http://chtsai.org/index_tw.html),简单、效果相对较好。由于它的简易直观性,实现起来不是很复杂,运行速度也比较快。关于算法的原文,可以参 见:http://technology.chtsai.org/mmseg/总的来说现在的中文分词算法,大概可以笼统的分为两大类:一种基于词转载 2014-09-19 14:45:12 · 506 阅读 · 0 评论 -
搜索质量评估
前言搜索质量评估是搜索技术研究的基础性工作,也是核心工作之一。评价(Metrics)在搜索技术研发中扮演着重要角色,以至于任何一种新方法与他们的评价方式是融为一体的。搜索引擎结果的好坏与否,体现在业界所称的在相关性(Relevance)上。相关性的定义包括狭义和广义两方面,狭义的解释是:检索结果和用户查询的相关程度。而从广义的层面,相关性可以理解为为用户查询的综合满意度。直观的来看,从用户转载 2014-09-19 16:44:58 · 4666 阅读 · 0 评论 -
说说单词智能纠错算法--探讨思考问题的方法
本文想从Office中的Word的语法检查和纠正功能发散开来,探讨一下这方面的相关算法和对问题的思考方式,以及怎么样从其他类似的地方受到启发不断解决新的问题。 先简单说说问题吧,我们在使用Word的时候经常会发现有些单词比如school,一不小心给敲成了shcool或者shool,这个时候Word会很体贴地提示我们这个英语单词错了(很简单shcool,shool在Word的字典库中都没有转载 2014-09-09 09:04:02 · 786 阅读 · 0 评论 -
Lingpipe中的spell模块-拼写纠错
lin基本模型基本技术工作如下:搜索引擎提供可使用的稳定被用来索引和被训练成为一种语言模型。这种语言模型存储的是短语和短语统计的特征信息。当提交一个查询时,类src/QuerySpellCheck.java 在模型中寻找与之匹配的字符编辑操作,诸如字符截取,插入,替换,转换和删除等等,这样使查询更好的适用于语言模型。如果你提交一个查询"Gretski",模型中的数据来源为rec转载 2014-09-09 13:06:48 · 654 阅读 · 0 评论