GBase 8a MPP Cluster 数据库支持全文检索,由于默认采用全单字索引方式,支持几乎所有的语种,并且可以保证 100%的查询召回率。结合 GBase 8a MPP Cluster 独特的列存储,压缩和智能索引技术,适合面向海量数据的检索查询应用。
支持对外部存储文档建立全文索引并提供检索,支持的文档格式如 txt、doc、XML、HTML、PDF、xls 等。
主要功能包括:
- 建立索引与搜索
- 在 GBase 8a MPP Cluster 中内嵌全文检索引擎,支持表中所有文本类型字段的索引与查询。
- 支持参数化管理,索引建立、分词、索引维护、搜索等过程均可以通过 GBase 8a MPP Cluster 的标准配置文件进行方便的配置。
- 在 GBase 8a MPP Cluster 中内嵌文本分词器功能,以实现对文本列、搜索串的单字切分,并能保证两者的切分规则、切分结果的一致性,防止由上下文语境导致的切分不一致。
- 支持全文索引同步查询,在创建索引过程中可实现查询功能。新追加数据可分批创建索引,当索引数据缓冲区中数据处理完成到索引文件后,用户可立即搜索到这些已创建索引的新内容,而不是等所有新数据都建好索引之后才能查询。
- 支持数据库表中已建立全文索引列的词句逻辑表达式查询(AND、OR、NOT)、NEAR 查询,并支持与非全文索引字段之间的逻辑组合查询。
- 支持 DML
- 支持数据库表中字符数据类型列已建立全文索引的在线删除。
- 支持列数据 Update 后全文索引的同步更新。
- 支持 DDL
- 支持数据库表在建立全文索引列被删除后,索引的自动失效。
- 支持数据库表重新命名后,索引不失效。