金仓数据库 KingbaseES 插件参考手册 zhparser

109. zhparser

109.1. 插件zhparser简介

zhparser是一个KingbaseES的扩展,主要用于全文搜索的中文分词。zhparser中文分词插件支持utf8和gbk字符集。

  • 插件名为 zhparser

  • 插件版本 V1.0

109.2. 插件zhparser加载方式

CREATE EXTENSION zhparser;

109.3. 插件zhparser的参数配置

zhparser.dict_in_memory

将词典全部加载到内存中,bool类型,默认值:false

zhparser.punctuation_ignore

忽略所有的标点等特殊符号,bool类型,默认值:false

zhparser.seg_with_duality

闲散文字自动以二元分词法聚合,bool类型,默认值:false

zhparser.multi_short

短词复合,bool类型,默认值:false

zhparser.multi_duality

散字二元复合,bool类型,默认值:false

zhparser.multi_zmain

重要单字复合,bool类型,默认值:false

zhparser.multi_zall

全部单字复合,bool类型,默认值:false

zhparser.extra_dicts

用户自定义词典文件列表,自定义词典文件必须放在share/tsearch_data目录中,示例:zhparser.extra_dicts ='dict.txt,mydict.xdb',string类型,默认值:无

109.4. 插件zhparser的使用方法

CREATE EXTENSION zhparser;

CREATE TEXT SEARCH CONFIGURATION testzhcfg (PARSER = zhparser);

ALTER TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH simple;

SELECT * FROM ts_parse('zhparser', 'KingbaseES中文分词插件测试');
tokid |   token
-------+------------
  101 | KingbaseES
  110 | 中文
  118 | 分词
  110 | 插件
  118 | 测试
 (5 rows)

SELECT to_tsvector('testzhcfg','KingbaseES中文分词插件测试');
                     to_tsvector
----------------------------------------------------
 'kingbasees':1 '中文':2 '分词':3 '插件':4 '测试':5
 (1 row)

SELECT to_tsquery('testzhcfg', '分词');
   to_tsquery
------------
  '分词'
 (1 row)

109.5. 插件zhparser的卸载方法

drop extension zhparser;

109.6. 插件zhparser升级方法

zhparser扩展插件通常随着KingbaseES安装包一并升级。通常情况下用户无须单独升级些插件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值