12.5. Parsers

12.5 解析器

文本检索解析器会将文档解析为一个个token。当前PostgreSQL仅提供一个内置文本解析器。

 

内置的文本解析器为pg_catalog.default。它可以识别23中token:

解析器对于“letter”的解读,依赖于lc_ctype值。

示例:

postgres=# SELECT alias, description, token FROM ts_debug('foo-bar-beta1');
      alias      |               description                |     token     
-----------------+------------------------------------------+---------------
numhword        | Hyphenated word, letters and digits      | foo-bar-beta1
hword_asciipart | Hyphenated word part, all ASCII          | foo
blank           | Space symbols                            | -
hword_asciipart | Hyphenated word part, all ASCII          | bar
blank           | Space symbols                            | -
hword_numpart   | Hyphenated word part, letters and digits | beta1
(6 rows)
SELECT alias, description, token FROM ts_debug('http://example.com/stuff/index.html');
alias | description | token
----------+---------------+------------------------------
protocol | Protocol head | http://
url | URL | example.com/stuff/index.html
host | Host | example.com
url_path | URL path | /stuff/index.html

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值