Q:FAST ESP支持哪些类型的文档?
A: 产品内置支持225种文档类型,包括XML,HTML,PDF,ASCII Text和MS Office格式(Word,PowerPoint,Excel…)。
另外,各个文档集合可以配置独立的文档处理方式和流程。
Q: FAST ESP同一个引擎能否支持多个数据源的索引和搜索?
A: FAST搜索平台将采集来的信息以集合为单位进行存储和管理,一个集合可以包含一个或多个数据源的信息。在单个节点上可以支持多个文档的索引集合,前端的搜索应用则可以对一个集合或多个集合进行搜索,而无需关注集合所处的物理节点。
Q: 产品是否同时支持对文档的索引和检索?
A: FAST搜索平台为单一逻辑索引维护多个索引文件,使能索引更新在临时目录,而同时还能提供搜索服务。
Q: FAST ESP索引的大小有限制吗?
A: 除非物理存储空间有限制,FAST搜索平台没有任何索引的大小限制。
Q:FAST ESP对网站信息是如何采集的?
A: FAST 搜索平台提供一个极高性能的Web爬虫,称为Enterprise Crawler,使能从一个或多个服务器发起信息采集,这种分布式的爬虫架构,使你的系统具有极高的伸缩性,包括目标网站的数量,文档集合数量和及时性;另外,网络爬虫还支持JavaScript和Flash。
Q:FAST ESP是否支持可调度的和定时的信息采集功能?
A: FAST搜索平台的网络爬虫可以配置信息采集之间的时间间隔,有这一个调度的特性,就可以为不同的站点配置不同的采集频率,还可以设置定时的信息采集功能,比如说一天中的某一时刻或者一周中的某一天,管理员可以将重新采集的时间调度到周末或者下班时间。
Q:FAST ESP如何鉴别和清除网页中的死链接?
A: FAST 搜索平台在重新采集某个网站时将从索引库中清除死的超级链接。如果某个网页中的链接在网络爬虫两次采集信息的过程中发生断裂,可以配置搜索服务器在将搜索结果表现给用户之前进行检查,然而这种做法会严重地影响性能。 FAST的大部分客户倒是愿意选择在增量索引时来清除死链接。
Q:FAST ESP 是否支持需要身份验证和授权访问的网页?
A: FAST搜索平台的网络爬虫支持代理登录方式采集需要身份验证和授权的网站,验证方式支持基本验证,Windows验证,和基于Cookie的验证,还具有客户化能力以适应较复杂的验证方式。
Q:FAST ESP是否支持SSL的网站?
A: FAST搜索平台的网络爬虫支持SSL协议,能采集HTTPS网站的内容。
A: FAST公司提供了丰富的基于Web的管理界面,用于创建,配置和管理搜索集合,监测和控制系统的组成部分。命令行工具还可用于脚本编程。
FAST 搜索平台还提供了一个全面的日志框架,采用W3C标准日志格式,记录所有服务的信息,警告和错误。 另外, 还提供日志检索和报表工具。
以下截屏是关于用户的搜索记录报表:
搜索报告包括最流行的检索,零结果检索,管理检索,观察检索,利用这些报表,管理员可以不断改进用户的搜索体验。
文档在搜索结果中的表现顺序取决于它和用户的检索条件的匹配程度,例如它是否包含检索条件中的关键字,关键字出现在标题或正文,或者文档的创建日期 ,但是FAST搜索平台还提供人工干预的手段,以适合企业的业务需求
排名推进(Boosting) 通过人工定义的方法改变自然的排序,将某篇文档的排名推前.
排名过滤(Blocking) 通过人工定义的方法阻止某篇文档出现在检索结果中
Q:产品是否支持SNMP协议的检测?
A: FAST 搜索平台的索引服务和检索服务都是内置了SNMP监控支持的,它们还能够在引擎出现以外或者磁盘空间,内存空间不够时通过邮件系统发出警告和通知。
Q:FAST ESP能集成哪些类型的内容储藏系统?
A: FAST 搜索平台通过连接器支持以下类型的数据源
标准的 FAST ESP 连接器
FAST Enterprise Crawler
File Traverser
Database Connector
其他连接器
BEA WebLogic
Documentum
IBM WebSphere
Lotus Notes
MS Exchange
MS SharePoint
Vignette
Hummingbird
FileNet
另外,还可以通过编程接口创建客户特殊需求的连接器。