全文检索:计算机索引程序扫描文章中的每一个词,对每一个词建立索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序根据实现建立的索引进行查找,并将查找的结果返回给用户的检索方式。
全文检索的方法包括按字检索和按词检索两种:
- 按字检索:对文章中的每一个字建立索引,由于字具有不同的含义,因此这种方式效果不佳。
- 按词索引:对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项。此方式下需要分词,中文分词比较复杂。
全文检索系统:按照全文检索理论建立起来的提供全文检索服务的系统。基本功能包括建立索引,提供查询。此外,现在的全文检索系统还需要具有方便的用户借口,面向WWW的开发接口,二次应用开发接口等。功能上全文检索系统核心具有建立索引,处理查询返回结果集,增加索引,优化索引结构等功能;结构上,全文检索系统具有索引引擎、查询引擎、文本分析引擎、对外借口等。