postgresql 分词_PostgreSQL分词zhparser自定义词典2.0

项目地址:https://github.com/amutu/zhparser

这里不在过多表述,大家看github就可以,主要描述下2.0版本的自定义词典的功能

** 自定义词库2.0 增加自定义词库的易容性, 并兼容1.0提供的功能 **

自定义词库需要superuser权限, 自定义库是数据库级别的(不是实例),每个数据库拥有自己的自定义分词

test=# SELECT * FROM ts_parse(‘zhparser’, ‘保障房资金压力’);

tokid | token

——-+——-

118 | 保障

110 | 房

110 | 资金

110 | 压力

test=# insert into zhparser.zhprs_custom_word values(‘资金压力’);

–删除词insert into zhprs_custom_word(word, attr) values(‘word’, ‘!’);

–\d zhprs_custom_word 查看其表结构,支持TD, IDF

test=# select sync_zhprs_custom_word();

sync_zhprs_custom_word

(1 row)

test=# \q –sync 后重新建立连接

[lzzhang@lzzhang-pc bin]$ ./psql -U lzzhang -d test -p 1600

test=# SELECT * FROM ts_parse(‘zhparser’, ‘保障房资金压力’);

tokid | token

——-+———-

118 | 保障

110 | 房

120 | 资金压力

[CitusDB中国]站主,PostgreSQL粉丝,现从事Citus研发工作

愿Citus在中国发展的越来越好

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值