FAST 常见问题-2

Q: FAST ESP作为互联网和企业海量信息智能搜索平台,内含了哪些功能?

A: FAST ESP 作为互联网和企业海量信息智能搜索平台,内含了以下功能:

1)信息采集:从企业内部和外部资源采集信息,是提出解决方案的基础。不同的信息来源需要使用不同的协议来导入,例如,网页内容一般需要使用http协议;新闻内容通常以xml格式投递到专用服务器/文件系统;企业内部信息一般存储在CMS,文件服务器,数据库系统等,也需要不同的协议来导入。

 FAST ESP™包含信息连接器,能自动监听更新的内容,包括来自网站,新闻资料,数据库和其他来源的信息。

2)信息处理:将非结构文档结构化的过程中涉及到自动分类和提取技术。自动分类就是根据已有的标题或者主题标记所有的文档,或者文档中的大段落,例如,确认一条新闻报道是关于合并与收购主题的就相应地标记它是这一类报道。提取技术就是从具体的文章内容中识别出"信息实体""信息元素"的过程, -例如,某人的名字就可以是一个"信息实体",从而可以分到与该人名有关的类别中。更先进的提取技术还可以提取复合信息类型,如将一个人的工作经历作为一个"信息实体"

FAST ESP™将自动分类和信息提取整合成一个完整的处理机制。第5版的FAST ESP™内置20多种提取器,并且还包含一个通用框架,通过这个框架可以灵活的开发新的提取器或基于现有的提取器做新的开发整合。FAST ESP™的分类和提取组件支持插拔式,可根据用户的需求进行选择配置。

3)检索与导航:系统能够通过专案和程序的方式查询到满足特定要求的信息。无论请求是预先确定的主题查询还是由最终用户直接发出的条件查询。此外,查询结果自动聚类导航不仅可以提高搜索的精度,而且可以对查询结果进行分析。

FAST ESP™提供状态索引和丰富的查询接口,实现高性能,高精确搜索和聚类导航。

4)扩展性和性能: FAST ESP™支持线性扩展,支持负载均衡的分布式体系结构,使低成本的硬件仍然能实现高性能,仍然能够处理每秒数以百计的更新,每秒数以千计的查询,并且仍能保持亚秒级的响应速度。

5)开放式体系结构:FAST ESP™是一个开放式体系结构支持多种开发接口与API ,包括一个JAVA APIC++ API.Net API,以及基于HTTP之上集成服务的XML API

 

QFAST支持的哪些检索方式?

A: FAST的搜索引擎支持以下类型的检索(无论哪种类型的检索,都不会导致性能的下降):

1、  多检索条目--可以指定多个检索条目,条目可以定义为单独的词或者一个词组的

2、  扩展词汇--可以只输入一个单词或词组的一个或多个字母并以”wild card”结尾

3、  包含/不包含操作--检索可以使用’+’’-’的来限定结果中包含或不包含某些关键词的记录。

4、  文字/数字表达式检索--检索支持基于文本的( and /or)基于数字的表达式检索

5、  近似检索--检索条目可以支持近似词汇检索;

6、  布尔词语--检索可以用布尔逻辑进行组合(如,”,””,””)

7、  整数比较--带整数值的检索条目可以使用数字比较(”>”,”<”,”=”)

8、  括号--支持括号检索,对检索条件进行多层次限定;

9、  字段检索--检索可以定义对一个特定文档域或者元素(字段名称:检索条目)的搜索的范围。字段信息可以包含对应于来自如数据库,XML元素,HTML标签与元标签(如创建日期,大小)的结构化源的信息。一种典型的应用是检索来自如数据库的结构化源的信息。还可用于结合内容的分类,如集合,分类学,安全属性时间/数据范围等

 

Q: FAST ESP搜索输入框是否支持下拉式自动提示

 AFAST默认支持基于特定语言字典为搜索输入框提供下拉式自动提示,在用户输入过程中自动提示相关搜索建议。另外,自动提示的字典可按照客户所在的行业进行客户化定制。

 

Q:FAST ESP搜索结果是否具有灵活的搜索结果排序方式?多重的排序方式?

AFAST的搜索引擎支持基于任何文件的属性的排序。默认排序方式是按照相关度,但任何其他属性可以使用(如日期,作者,大小,文件类型) 。此外,还可以有多个层次的排序。例如,在相关度排序后再按日期进行排序,反之亦然。最后,任何一种级别的排序都可以升序和降序。排序顺序在检索时指定。FAST使用的排序方法内置在核心引擎,因此在使用时不产生任何性能损失。

 

Q:FAST ESP是否允许搜索过滤器?帮助用户缩小检索范围,如按类别,功能,语言和时间。

A: FAST ESP称这些搜索过滤器为导航器,他们可以预先明确地加以定义,如类别等,在文档的处理过程中,它们被自动识别和生成。

FAST ESP配备20多个即开即用的实体类型,如适当的名称,公司名称,大学名称,邮政编码等。

 

Q: FAST ESP是否支持根据用户的需求而定义的导航器?

A: FAST ESP实体提取和匹配框架允许使用规则和字典来识别实体,支持任何类型的实体。

利用这个框架可以根据用户的需求进行任意的扩展,增加产品名称,编号,产品属性;服务和项目等导航器。

 

Q: FAST ESP是否支持自然语言检索,如果支持,如何实现?

自然语言搜索能力是指一个搜索引擎能在用户按日常说话方式进行检索时,也能返回相关的结果。这意味着,用户输入检索的形式是一个问题或陈述,而不是关键字。处理过程通过分解检索语句,过滤那些和相关度无关的词语,解释问题或修饰符的含义,被称为自然语言处理。自然语言处理的最终目标是是把''检索变成成一个''的检索,以返回相关的结果集。

FAST支持自然语言搜索,关键词搜索和布尔搜索。FAST将其语义学处理能力作为自然语言处理的核心,把一个坏的检索转变为一个很好的检索。

用户检索的转换在多个层次进行,语义学处理能力能让用户不仅能检索,还能获得搜索结果基于概念和目录的分类,FAST的动态分类和动态钻取能力让用户可以通过导航器进行检索,以逐步帮助他们缩小搜索范围,快速获得最相关的结果,随着时间的推移,这些工具最终训练用户如何使用先进的搜索和以获得高质量的搜索体验。

下面的语言功能,可处理自然语言搜索,并把一个坏的检索到一个很好的检索:

拼写检查和搜索建议
词根化
同义词扩展
词组检测和实体识别(识别和建议词组,产品名称或其他常见的实体或想法)
动态聚类(从搜索结果中提取概念,并且将它们组成有关联的议题类似的概念
”)
分类(能够动态的或基于训练的方式将搜索结果分为可浏览的组别)

动态钻取(能够基于可搜索的项目或产品属性进行浏览,比如基于项目的参数,如文件大小,语言,部门,作者等)

字词规范化(如繁体和简体的转换,大写数字和小写数字的转换)

忽略无用或无关的字词

除了以上的基本功能,FAST还致力提供系统的调节能力,灵活性和可扩展性。这意味着,可以在许多层面进行相关度的调整以符合用户的需要。报表可以帮助系统管理员能够更好地了解最终用户使用什么类型的搜索以及获得的是什么样的结果,随着时间的推移,系统可逐步调优,信息的变化使用户群变得更精通搜索。该系统是灵活的,允许基于信息的内容定制的语义学特征,包括自定义的字典以及用户的期望。企业可以客户化自己的术语,短语,拼写检查,搜索建议和同义词。

 

Q:FAST单个检索能否组合不同的检索方式?

A:不同方式的检索可以按布尔逻辑的形式进行组合。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值